网络爬虫入侵网站犯罪案例（网络爬虫合法）-黑客24小时在线接单网站

本文目录一览：

1、违反Robots协议被索赔一亿的案例（上）
2、爬虫违法吗?
3、数据爬虫的是与非：技术中立但恶意爬取频发，侵权边界在哪？
4、只因写了一段爬虫，公司200多人被抓，爬虫究竟是否违法？
5、爬虫究竟是合法还是违法的？
6、数据爬虫行为如何合规？

违反Robots协议被索赔一亿的案例（上）

2013年1月28日，北京一中院受理某度诉某虎不正当竞争纠纷案并在2014年8月7日作出2668号判决。昨天介绍了诉讼爆发的背景，今天直接看判决内容。

争议行为

双方观点

对《自律公约》的评价

本案原被告双方都援引《自律公约》，主张对方行为不当。

但作为在互联网协会的牵头组织下，由搜索引擎行业内具有较高代表性且占有绝大部分市场份额的企业共同达成的行业共识，《自律公约》可以反映和体现了行业内的公认商业道德和行为标准。

争议焦点

搜索引擎的工作原理简单说就是用户发出搜索要求后，搜索引擎按照事先确定的计算方法，从海量的网上信息中，将符合用户要求的网页挑出，按照特定的排序提供给用户。

这种“挑出”不是收到用户搜索要求后才进行的，而是事先采用网络爬虫技术对信息作出收集、处理，并存储在搜索引擎服务器上，用以提升处理效率。

判决提及，搜索引擎的出现提升了用户获取信息的效率，但也因为搜索方会千方百计增加网络爬虫访问网页的效率，对当时薄弱的互联网基础设施（网站的服务器容量、网络带宽等）产生冲击，引发网站服务商或所有者的不满。

为了解决这个问题，行业中有人发起和制定Robots协议，通过在网站程序写入robots.txt文件，标示限制搜索引擎爬虫机器人访问的信息。

法院认为，Robots协议具有技术规范、单方宣示、普遍遵守、非技术措施四个属性，并非法律意义上的协议或合同，也不会起到强制禁止访问的「技术措施」作用。但是， Robots协议已经成为了一种国内外互联网行业内普遍通行、普遍遵守的技术规范。从国内外因搜索引擎拒绝遵守Robots协议而引起的纠纷甚为少见，也可以侧面看出这一点。

-未完待续-

爬虫违法吗?

法律分析：下列三种情况，爬虫有可能违法，严重的甚至构成犯罪：

爬虫程序规避网站经营者设置的反爬虫措施或者破解服务器防抓取措施，非法获取相关信息，情节严重的，有可能构成“非法获取计算机信息系统数据罪”。

爬虫程序干扰被访问的网站或系统正常运营，后果严重的，触犯刑法，构成“破坏计算机信息系统罪”

爬虫采集的信息属于公民个人信息的，有可能构成非法获取公民个人信息的违法行为，情节严重的，有可能构成“侵犯公民个人信息罪”。

法律依据：《中华人民共和国刑法》

第二百八十五条违反国家规定，侵入国家事务、国防建设、尖端科学技术领域的计算机信息系统的，处三年以下有期徒刑或者拘役。

违反国家规定，侵入前款规定以外的计算机信息系统或者采用其他技术手段，获取该计算机信息系统中存储、处理或者传输的数据，或者对该计算机信息系统实施非法控制，情节严重的，处三年以下有期徒刑或者拘役，并处或者单处罚金；情节特别严重的，处三年以上七年以下有期徒刑，并处罚金。

提供专门用于侵入、非法控制计算机信息系统的程序、工具，或者明知他人实施侵入、非法控制计算机信息系统的违法犯罪行为而为其提供程序、工具，情节严重的，依照前款的规定处罚。

单位犯前三款罪的，对单位判处罚金，并对其直接负责的主管人员和其他直接责任人员，依照各该款的规定处罚。

第二百五十三条之一违反国家有关规定，向他人出售或者提供公民个人信息，情节严重的，处三年以下有期徒刑或者拘役，并处或者单处罚金；情节特别严重的，处三年以上七年以下有期徒刑，并处罚金。

数据爬虫的是与非：技术中立但恶意爬取频发，侵权边界在哪？

从新浪微博诉脉脉不正当获取用户数据案，到领英与hiQ Labs的数据之争……相关司法案例的不断出现，让数据爬取问题成为关切。

10月23日，长三角数据合规论坛(第三期)暨数据爬虫的法律规制研讨会在上海举行。围绕爬虫技术对数字产业影响、爬取他人数据的法律边界及规制等话题，多位法律专家、司法工作者和企业代表展开了研讨。

大数据时代，随着数据价值凸显，数据爬虫的应用日益广泛。多位专家在会上提到，爬虫技术本身是中立的，但爬虫技术的应用往往带有目的，需要考量抓取行为及数据使用是否具有正当性。

“凶猛”的网络爬虫，增加网站运营负担

从技术角度看，爬虫是通过程序模拟人们上网浏览网页或使用App行为，从而高效抓取网络信息的过程。对于这项技术，并非所有人都欢迎。

欧莱雅中国数字化负责人刘煜晨在研讨会上表示，大多数网站拒绝爬虫访问，既有商业利益考量，也出于自身网站运营安全考虑。爬虫自动持续且高频地访问，会导致网站服务器负载飙升，使得一些中小平台面临网站打不开、网页加载缓慢，甚至直接瘫痪的风险。因此，“网站经营者面对‘凶猛’的网络爬虫时往往苦不堪言。”

虽然网站可以采取相应策略或技术手段，防止被爬取数据，但爬虫者也有更多技术手段来反制，即所谓的反反爬策略。据刘煜晨介绍，反爬和爬取技术一直在迭代更新——爬取不是问题，关键在于愿不愿意爬和多难爬。通常，越是大厂的App或者网站越难爬，其反爬机制较多。

小红书法务负责人曾翔观察发现，恶意爬虫案例经常发生在内容平台和电商平台。在内容上更多被爬取视频、图片、文字、用户行为数据等，在电商领域更多被爬取商家信息和商品信息。

“一般而言，内容平台会约定相关内容的知识产权应当归发布者或发布者与平台共同所有。未经同意爬取的，涉嫌侵犯知识产权。”曾翔表示，平台通过投入激发创作者的创造力，如果有人利用爬虫技术很轻易地获取内容，并进行抄袭、改编，这损害平台利益。

提及网络爬虫，Robots协议是绕不开的话题——它的全称是“网络爬虫排除标准”，网站通过Robots协议明确警示搜索引擎哪些页面可以爬取，哪些页面不能爬取。该协议也被行业称为搜索领域的“君子协定”。

上海浦东法院知识产权庭法官徐弘韬这样形容：爬虫就是一个访客，Robots协议是房门上悬挂的请勿入门的告示牌。谦谦君子走近门前看到这个告示牌，会停下脚步，但不法之徒仍可能破门而入。

梳理相关判例，徐弘韬指出，Robots协议是互联网行业普遍遵循的规则，如果搜索引擎违反Robots协议抓取网站内容，可能会被认定为违背商业道德，构成不正当竞争。但Robots协议解决前置性问题，即抓取行为是否得当，而不解决抓取之后数据使用是否得当的问题。

他进一步分析，法院在个案件判决中倾向于认为爬虫技术是具有中立属性，并尊重网站对于Robots协议设置方式。如果爬取者违背Robots协议进行强行抓取，在正当性评判上可能给予一定的负面评价。此外Robots协议和行为正当性有关联，但不是唯一对立性——即使符合Robots协议抓取，也可能因为后期使用行为被判定为不正当性。

值得一提的是，网络爬虫者对爬取行为进行抗辩时，经常将Robots协议限制爬取与数据流转联系起来。

徐弘韬认为，在“互联互通”的语境下，“有序”和“流转”同等重要。这需要把握“互联互通”与数据共享之间的度的问题，同时考虑各互联网产业经营者采取的Robots协议策略是否可能导致数据孤岛局面的出现。

判别爬虫行为正当性，需考虑多重因素

研讨会上，华东政法大学教授张勇对数据爬虫的危害行为进行了分类。

他称从数据类型上来看，数据爬取可能侵犯到的权益包括计算机系统安全、个人信息、版权、国家秘密、商业秘密、市场竞争秩序等；从爬取方式来看，数据爬取可能危害到计算机信息系统安全、非法获取公民个人信息、非法获取商业秘密、破坏版权技术保护措施等；从爬取结果来看，则存在不正当竞争类、侵犯著作权类、侵犯人格权类等问题。

当数据成为一种生产要素，数据抓取技术应用场景日益广泛，随着而来的争议纠纷也不断增多。如何判别爬虫行为的正当性，从已有的判例中或能找到一些答案。

今年9月14日，杭州互联网法院公布一起爬取微信公众号平台数据的不正当竞争案件，判决被告停止数据抓取行为，并赔偿微信损失60万元。

法院审理认为，被告违背诚实信用原则，擅自使用原告征得用户同意、依法汇集且具有商业价值的数据，并足以实质性替代其他经营者提供的部分产品或服务，损害公平竞争的市场秩序，构成不正当竞争。

在本案中，法院还从“三元目标叠加”的角度分析了爬取行为是否具有正当性。

徐弘韬以此为例提到，对于非搜索引擎爬虫的正当性判别，主要看被告是否尊重被抓取网站预设的Robots协议、是否破坏被抓取网站的技术措施、是否足以保障用户数据的安全性，以及衡量创造性与公共利益。

他指出，如果以危害用户数据安全性为代价抓取数据，且爬虫技术应用无法创造新的优质资源，仅仅是加重他人服务器负担，那么很可能在行为正当性上被给予负面评价。

只因写了一段爬虫，公司200多人被抓，爬虫究竟是否违法？

01.技术纯真

许多朋友向我传达了一个信息：技术是无辜的，技术本身没有对与错，但是使用技术的人是对还是错。如果公司或程序员知道使用其技术是非法的，则公司或个人需要为此付出代价。

在今年颁布了《中华人民共和国网络安全法》之后，许多以前处于灰色地带的企业无法开展。

您看不到以前非常流行的各种社会工作者网站。现在大多数人都消失了吗？因为最新的安全法强调出售超过50条个人信息属于“严重情况”，需要履行其法律责任。

许多草根网站管理员主动关闭了该网站。目前有很多涉及版权信息的网站，如书籍，影视剧，课程等，在后期也将面临越来越严格的审查。

02.哪种爬虫是非法的？

爬虫不能是私人的！

如果爬虫程序收集了诸如公民的姓名，身份证号码，通讯联系信息，地址，密码，财产状态，轨道等个人信息，并以非法方式使用它，则绝对构成非法获取信息的行为。公民的个人信息。

就是说，您爬网信息没有问题，但是不会涉及个人隐私。如果涉及并通过非法手段获得收益，那么它必定是非法的。

此外，在以下三种情况下，爬行动物可能是非法的，严重的，甚至构成犯罪：

如果爬虫程序逃避了网站运营商设置的反爬虫措施或违反了服务器的反捕获措施以非法获取相关信息，情节严重，则可能构成非法获取计算机信息数据的犯罪行为。系统。

如果搜寻器程序干扰了所访问的网站或系统的正常运行并造成了严重后果，则将违反刑法，并构成“破坏计算机信息系统”的罪行。

如果爬虫收集的信息属于公民的个人信息，则可能构成非法获取公民的个人信息的非法行为。如果情况严重，可能构成侵犯公民个人信息的罪行。

现在，Internet上有许多付费课程，例如极客时间，知识星球等。如果这些付费内部信息被非法爬网出售并从中获利，则属于违法行为。

在遇见网民之前，我抢了各种知识之星的内容，并自行出售。我觉得我找到了一个巨大的商机。实际上，我不知道这种行为实际上是非常危险的，风险和收益显然是不平等的。

当我看到这两天时，他的一个公共电话号码被密封了，后来他转了个喇叭继续做下去。迟早他被封锁了。最可怜的是那些购买他的服务的人，因为当他做广告时，他承诺他永远也做不到。

03.哪种爬虫合法？

1.遵守机器人协议

机械手协议，也称为robots.txt（统一的小写字母），是存储在网站根目录中的ASCII文本文件。它通常告诉网络搜索引擎的漫游者（也称为网络蜘蛛），该网站上的哪些内容不应由搜索引擎的漫游者获取，而漫游者可以获取哪些内容。

漫游器协议旨在告诉抓取工具哪些信息可以被抓取，哪些信息不能被抓取。严格按照漫游器协议爬网与网站相关的信息通常不会造成太多问题。

2.不要使另一台服务器瘫痪

但这并不意味着只要爬虫遵守机器人协议，就不会有问题。还涉及两个因素。首先是大型爬网程序无法使另一端的服务器瘫痪，这相当于网络攻击。

在国家互联网信息办公室于2019年5月28日发布的数据安全管理措施（征求意见稿）中，建议以行政法规的形式限制爬行动物的使用：

网络运营商应采用自动方式访问和收集网站数据，不得妨碍网站的正常运行；此类行为严重影响网站的运行，例如自动访问收集流量超过网站每日平均流量的三分之一，并且在要求停止自动访问收集时网站应停止。

3.无非法利润

恶意使用爬虫技术来获取数据，抢占不正当竞争优势甚至谋取非法利益可能是违法的。实际上，由于非法使用爬虫技术来捕获数据而引起的纠纷数量并不大，其中大多数是基于不正当竞争而提起诉讼的。

例如，如果您获取了公众评论上的所有公共信息，则您复制了一个相似的网站并从该网站中获得了很多利润。这也是一个问题。

一般来说，爬虫是为企业造福的。因此，爬虫开发者的道德自力更生和企业管理者的良知对于避免触及法律底线至关重要。

网络爬虫入侵网站犯罪案例（网络爬虫合法）

爬虫究竟是合法还是违法的？

据说互联网上 50%以上的流量都是爬虫创造的，也许你看到很多热门数据都是爬虫所创造的，所以可以说无爬虫就无互联网的繁荣。

前天写了一篇文章《只因写了一段爬虫，公司200多人被抓！》，讲述程序员因写爬虫而被刑侦的事件。文章传播很广，评论中讨论最热是：爬虫究竟是合法还是违法的？

这个话题涉及到我们很多程序员的日常工作，所以有必要和大家细聊一下。

01.技术无罪？

在今年国家颁布《中华人民共和国网络安全法》之后，很多以前处于灰色地带的业务都不能做了。

君不见之前曾经非常火的各种社工库网站，现在绝大部分都已经消失匿迹了吗？因为最新的安全法强调：贩卖个人信息超过50条属于“情节严重”，需要追求其法律责任。

很多草根站长都纷纷主动关闭了网站；还有很多涉及版权信息的网站，比如书籍、影视剧、课程等后期也会面临越来越严格的审查，这就是目前大的形势。

2014年12月20日，人人影视字幕站发布微博称，人人影视正式关闭，并表示或将继续为正版商提供翻译服务，也可能转变为讨论社区的形式。

2019年6月，吾爱破解因版权问题关站整改...

.....

随着中国经济的不断往前走，知识产权问题会越来越重视，非法爬虫是现在一个重要的打击部分，

如果有程序员走在灰色的边缘尽早收手，不要因为一点小的收益导致触犯法律，从而得不偿失。

技术是无罪的，但是用到了错的地方代价也是非常巨大的。

02.爬虫岗位人人自危

我在拉钩上搜索：爬虫工程师，显示有 217 条相关招聘信息，薪资从10-60k 都有，说明市场上对爬虫的需求是很大的。

简单回答一下这些问题：

还有朋友认为这事责任在企业不在程序员，日常工作中项目初期设计和最后上线需要通过公司的法务批准，所有代码必须有其他程序员同事评审通过才能提交。

这位朋友说的挺对的，按道理每个公司都应该有法务和风控在前面，后面才是产品设计和程序员开发的事情，但如果一家公司为了利益，老板可以直接让这两个部门闭嘴，后面程序员可以不干吗？

更甚至很多公司其实就没有这两个部门或者说形同虚设。那么做为程序员自己也需要操一份心，凡是涉及到入侵类的程序都不能干，因为有一个东西叫做：单位犯罪。

单位犯罪，是指公司、企业、事业单位、机关、团体为单位谋取利益，经单位决策机构或者负责人决定实施的，法律规定应当负刑事责任的危害社会的行为。

我国刑法对单位犯罪原则上采取双罚制度，即单位犯罪的，对单位判处罚金，并对其直接负责的主管人员和其他直接责任人员判处刑罚。

03.什么样的爬虫是非法的？

爬虫不能涉及个人隐私！

如果爬虫程序采集到公民的姓名、身份证件号码、通信通讯联系方式、住址、账号密码、财产状况、行踪轨迹等个人信息，并将之用于非法途径的，则肯定构成非法获取公民个人信息的违法行为。

也就是说你爬虫爬取信息没有问题，但不能涉及到个人的隐私问题，如果涉及了并且通过非法途径收益了，那肯定是违法行为。

另外，还有下列三种情况，爬虫有可能违法，严重的甚至构成犯罪：

现在网上有很多付费的课程，比如极客时间、Gitchat、慕课网、知识星球等等，这些付费内部信息如果被非法爬取手法出售获利，一种违法行为。

之前我就遇到一个网友，把各个知识星球的内容都抓下来，合到一起自己去卖，自作聪明觉得发现了一个大的商机，其实自己不知道这个行为其实很危险，风险和收益明显不对等。

我这两天看的时候，他的一个公众号都被封了，后来又转移了一个小号继续搞，迟早又是被封的命运，真的很不值当。最可怜是那些买他服务的用户，因为他宣传时承诺永久，肯定永久不了。

04.什么样的爬虫是合法的？

1、遵守 Robots 协议

Robots 协议也叫 robots.txt（统一小写）是一种存放于网站根目录下的 ASCII 编码的文本文件，它通常告诉网络搜索引擎的漫游器（又称网络蜘蛛），此网站中的哪些内容是不应被搜索引擎的漫游器获取的，哪些是可以被漫游器获取的。

Robots 协议就是告诉爬虫，哪些信息是可以爬取，哪些信息不能被爬取，严格按照 Robots 协议爬取网站相关信息一般不会出现太大问题。

2、不能造成对方服务器瘫痪

但不是说只要遵守 Robots 协议的爬虫就没有问题，还涉及到两个因素，第一不能大规模爬虫导致对方服务器瘫痪，这等于网络攻击。

2019年05月28日国家网信办发布的《数据安全管理办法（征求意见稿）》中，拟通过行政法规的形式，对爬虫的使用进行限制：

网络运营者采取自动化手段访问收集网站数据，不得妨碍网站正常运行；此类行为严重影响网站运行，如自动化访问收集流量超过网站日均流量三分之一，网站要求停止自动化访问收集时，应当停止。

3、不能非法获利

恶意利用爬虫技术抓取数据，攫取不正当竞争的优势，甚至是牟取不法利益的，则可能触犯法律。实践中，非法使用爬虫技术抓取数据而产生的纠纷其实数量并不少，大多是以不正当竞争为由提请诉讼。

举个例子，如果你把大众点评上的所有公开信息都抓取了下来，自己复制了一个一模一样的网站，并且还通过这个网站获取了大量的利润，这样也是有问题的。

一般情况下，爬虫都是为了企业获利的，因此需要爬虫开发者的道德自持和企业经营者的良知才是避免触碰法律底线的根本所在。

05.最后

有风险的行业谨慎进入，比如现金贷、不合规的P2P、赌博类游戏、黑五类产品的行业。如果公司安排入侵某个网站数据，或者有同事/朋友邀请泄露公司信息的都需要保持警惕，有时候一个很小的动作都有可能导致出问题。

我们绝大多数公司和个人使用的爬虫都是没有问题的，不必人人自危，只要把握住不要爬取个人信息，不要利用爬虫非法获利，不要爬取网站的付费内容，基本上不会有问题。

程序员是世界上最单纯的一批人，也是一批高智商低情商的人，工作是工作但也需要适当保持谨慎，对于一些游走在法律边缘的事情请保持距离。

敬畏法律，遵纪守法，从我做起。

参考：

作者：纯洁的微笑 .出处：

数据爬虫行为如何合规？

前言

由于网络数据爬取行为具有高效检索、批量复制且成本低廉的特征，现已成为许多企业获取数据资源的方式。也正因如此，一旦爬取的数据设计他人权益时，企业将面临诸多法律风险。本文将从数据爬取行为的相关概述、数据爬取相关立法规定，结合数据爬取行为近期典型案例，探讨数据爬取行为的合规要点。

一、数据爬取行为概述

数据爬取行为是指利用网络爬虫或者类似方式，根据所设定的关键词、取样对象等规则，自动地抓取万维网信息的程序或者脚本，并对抓取结果进行大规模复制的行为。

使用爬虫爬取数据的过程当中，能否把握合法边界是关系企业生死存亡的问题。近些年大数据、人工智能的广泛使用，对各种数据的刚性需求，使数据行业游走在“灰色边缘”。面对网络数据安全的“强监管”态势，做好数据合规、数据风控刻不容缓。当前我国并没有相关法律法规对数据爬取行为进行专门规制，而是根据爬取数据的不同“质量”，主要通过《中华人民共和国著作权法》（以下简称“《著作权法》）、《中华人民共和国反不正当竞争法》（以下简称“《反不正当竞争法》”）、《中华人民共和国刑法》（以下简称“《刑法”》）等现有法律法规进行规制。

二、数据爬取相关法律责任梳理

（一）承担刑事责任

1、非法侵入计算机信息系统罪

《刑法》第285条第1款规定了“非法侵入计算机信息系统罪”，违反国家规定，侵入国家事务、国防建设、尖端科学技术领域的计算机信息系统的，处三年以下有期徒刑或者拘役。

典型案例：李某等非法侵入计算机信息系统罪(2018)川3424刑初169号

本案中，被告人李某使用“爬虫”软件，大量爬取全国各地及凉山州公安局交警支队车管所公告的车牌放号信息，之后使用软件采用多线程提交、批量刷单、验证码自动识别等方式，突破系统安全保护措施，将爬取的车牌号提交至“交通安全服务管理平台”车辆报废查询系统，进行对比，并根据反馈情况自动记录未注册车牌号，建立全国未注册车牌号数据库。之后编写客户端查询软件，由李某通过QQ、淘宝、微信等方式，以300-3000元每月的价格，分省市贩卖数据库查阅权限。

法院认为，被告人李文某为牟取私利，违法国家规定，侵入国家事务领域的计算机信息系统，被告人的行为均已构成非法侵入计算机信息系统罪。

2、非法获取计算机信息系统数据罪

《刑法》第285条第2款规定如下，违反国家规定，侵入前款规定以外的计算机信息系统或者采用其他技术手段，获取该计算机信息系统中存储、处理或者传输的数据，或者对该计算机信息系统实施非法控制，情节严重的，处三年以下有期徒刑或者拘役，并处或者单处罚金；情节特别严重的，处三年以上七年以下有期徒刑，并处罚金。同时，《最高人民法院、最高人民检察院关于办理危害计算机信息系统安全刑事案件应用刑事案件应用法律若干问题的解释》第1条对“情节严重”作出了具体的规定：“非法获取计算机信息系统数据或者非法控制计算机信息系统，具有下列情形之一的，应当认定为刑法第二百八十五条第二款规定的“情节严重”：（一）获取支付结算、证券交易、期货交易等网络金融服务的身份认证信息十组以上的；（二）获取第（一）项以外的身份认证信息五百组以上的；（三）非法控制计算机信息系统二十台以上的；（四）违法所得五千元以上或者造成经济损失一万元以上的；（五）其他情节严重的情形。”

典型案例：李某、王某等非法获取计算机信息系统数据、非法控制计算机系统案（2021）沪0104刑初148号

本案中，益采公司在未经淘宝（中国）软件有限公司授权许可的情况下，经李某授意，益采公司部门负责人被告人王某、高某等人分工合作，以使用IP代理、“X-sign”签名算法等手段突破、绕过淘宝公司的“反爬虫”防护机制，再通过数据抓取程序大量非法抓取淘宝公司存储的各主播在淘宝直播时的开播地址、销售额、观看PV、UV等数据。至案发，益采公司整合非法获取的数据后对外出售牟利，违法所得共计人民币22万余元。法院认为被告人李某、王某、高某等人构成非法获取计算机信息系统数据罪，分别判处有期徒刑二年六个月、一年三个月不等，并处罚金。

法院认为，被告人李文某为牟取私利，违法国家规定，侵入国家事务领域的计算机信息系统，被告人的行为均已构成非法侵入计算机信息系统罪。

3、提供侵入、非法控制计算机信息系统程序、工具罪

《刑法》第285条第3款对该罪规定如下，提供专门用于侵入、非法控制计算机信息系统的程序、工具，或者明知他人实施侵入、非法控制计算机信息系统的违法犯罪行为而为其提供程序、工具，情节严重的，依照前款的规定处罚。《最高人民法院、最高人民检察院关于办理危害计算机信息系统安全刑事案件应用刑事案件应用法律若干问题的解释》中还列举了“具有避开或者突破计算机信息系统安全保护措施，未经授权或者超越授权获取计算机信息系统数据的功能的”等类型的程序、工具。

典型案例：陈辉提供侵入、非法控制计算机信息系统程序、工具罪（2021）粤0115刑初5号

本案中，被告人陈辉为牟取非法利益，在本区编写爬虫软件用于在浙江淘宝网络有限公司旗下的大麦网平台上抢票，并以人民币1888元到6888元不等的价格向他人出售该软件，非法获利人民币12万余元。2019年7月11日，被告人陈辉被公安机关抓获。经鉴定，上述爬虫软件具有以非常规的方式构造和发送网络请求，模拟用户在大麦网平台手动下单和购买商品的功能；具有以非常规手段模拟用户识别和输入图形验证码的功能，该功能可绕过大麦网平台的人机识别验证机制，以非常规方式访问大麦网平台的资源。

本院认为，被告人陈辉提供专门用于侵入、非法控制计算机信息系统程序、工具，情节特别严重，依法应予惩处。

4、侵犯公民个人信息罪

《刑法》第253条中规定了该罪，违反国家有关规定，向他人出售或者提供公民个人信息，情节严重的，处三年以下有期徒刑或者拘役，并处或者单处罚金；情节特别严重的，处三年以上七年以下有期徒刑，并处罚金。违反国家有关规定，将在履行职责或者提供服务过程中获得的公民个人信息，出售或者提供给他人的，依照前款的规定从重处罚。窃取或者以其他方法非法获取公民个人信息的，依照第一款的规定处罚。

典型案例：杭州魔蝎数据科技有限公司、周江翔、袁冬侵犯公民个人信息罪（2020）浙0106刑初437号

本案中，被告人周江翔系魔蝎公司法定代表人、总经理，负责公司整体运营，被告人袁冬系魔蝎公司技术总监，系技术负责人，负责相关程序设计。魔蝎公司主要与各网络贷款公司、小型银行进行合作，为网络贷款公司、银行提供需要贷款的用户的个人信息及多维度信用数据，方式是魔蝎公司将其开发的前端插件嵌入上述网贷平台A**中，在网贷平台用户使用网贷平台的APP借款时，贷款用户需要在魔蝎公司提供的前端插件上，输入其通讯运营商、社保、公积金、淘宝、京东、学信网、征信中心等网站的账号、密码，经过贷款用户授权后，魔蝎公司的爬虫程序代替贷款用户登录上述网站，进入其个人账户，利用各类爬虫技术，爬取（复制）上述企、事业单位网站上贷款用户本人账户内的通话记录、社保、公积金等各类数据。

法院认为，被告单位杭州魔蝎数据科技有限公司以其他方法非法获取公民个人信息，情节特别严重，其行为已构成侵犯公民个人信息罪。被告人周江翔、袁冬分别系对被告单位魔蝎公司侵犯公民个人信息行为直接负责的主管人员和其他直接责任人员，其行为均已构成侵犯公民个人信息罪。

5、侵犯著作权罪

根据《刑法》第217条规定，以营利为目的，有下列侵犯著作权或者与著作权有关的权利的情形之一，违法所得数额较大或者有其他严重情节的，处三年以下有期徒刑，并处或者单处罚金；违法所得数额巨大或者有其他特别严重情节的，处三年以上十年以下有期徒刑，并处罚金：（一）未经著作权人许可，复制发行、通过信息网络向公众传播其文字作品、音乐、美术、视听作品、计算机软件及法律、行政法规规定的其他作品的；（二）出版他人享有专有出版权的图书的；（三）未经录音录像制作者许可，复制发行、通过信息网络向公众传播其制作的录音录像的；（四）未经表演者许可，复制发行录有其表演的录音录像制品，或者通过信息网络向公众传播其表演的；（五）制作、出售假冒他人署名的美术作品的；（六）未经著作权人或者与著作权有关的权利人许可，故意避开或者破坏权利人为其作品、录音录像制品等采取的保护著作权或者与著作权有关的权利的技术措施的。

典型案例：谭某某等侵犯著作权罪（2020）京0108刑初237号

本案中，被告鼎阅公司自2018年开始，在覃某某等12名被告人负责管理或参与运营下，未经掌阅科技股份有限公司、北京幻想纵横网络技术有限公司等权利公司许可，利用网络爬虫技术爬取正版电子图书后，在其推广运营的“鸿雁传书”“TXT全本免费小说”等10余个App中展示，供他人访问并下载阅读，并通过广告收入、付费阅读等方式进行牟利。根据经公安机关依法提取收集并经勘验、检查、鉴定的涉案侵权作品信息数据、账户交易明细、鉴定结论、广告推广协议等证据，法院查明，涉案作品侵犯掌阅科技股份有限公司、北京幻想纵横网络技术有限公司享有独家信息网络传播权的文字作品共计4603部，侵犯中文在线数字出版集团股份有限公司享有独家信息网络传播权的文字作品共计469部。

法院认为，鼎阅公司、直接负责的主管人员覃某某等12名被告人以营利为目的，未经著作权人许可，复制发行他人享有著作权的文字作品，情节特别严重，其行为均已构成侵犯著作权罪，应予惩处。

（2）构成不正当竞争

我国《反不正当竞争法》第12条规定：“经营者利用网络从事生产经营活动，应当遵守本法的各项规定。经营者不得利用技术手段，通过影响用户选择或者其他方式，实施下列妨碍、破坏其他经营者合法提供的网络产品或者服务正常运行的行为：（一）未经其他经营者同意，在其合法提供的网络产品或者服务中，插入链接、强制进行目标跳转；（二）误导、欺骗、强迫用户修改、关闭、卸载其他经营者合法提供的网络产品或者服务；（三）恶意对其他经营者合法提供的网络产品或者服务实施不兼容；（四）其他妨碍、破坏其他经营者合法提供的网络产品或者服务正常运行的行为。

典型案例：深圳市腾讯计算机系统有限公司、腾讯科技（深圳）有限公司与被告某新媒体公司不正当竞争纠纷案

本案中，两原告系微信公众平台的经营者和管理者，被告某新媒体公司系某网站经营者，利用爬虫技术抓取微信公众平台文章等信息内容数据，并通过网站对外提供公众号信息搜索、导航及排行等数据服务。原告诉称，被告利用被控侵权产品，突破微信公众平台的技术措施进行数据抓取，并进行商业化利用，妨碍平台正常运行，构成不正当竞争。被告辩称，爬取并提供公众号数据服务的行为不构成不正当竞争，其爬取的文章并非腾讯公司的数据，而是微信公众号的用户数据，且其网站获利较少。

法院认为，被告违背诚实信用原则，擅自使用原告征得用户同意、依法汇集且具有商业价值的数据，并足以实质性替代其他经营者提供的部分产品或服务，损害公平竞争的市场秩序，属于《反不正当竞争法》第十二条第二款第四项所规定的妨碍、破坏其他经营者合法提供的网络产品或者服务正常运行的行为，构成不正当竞争。

（3）行政责任

我国当前关于爬虫行为所应承担的行政责任主要规定在《网络安全法》中，其中涉嫌违反第27条规定的：“任何个人和组织不得从事非法侵入他人网络、干扰他人网络正常功能、窃取网络数据等危害网络安全的活动；不得提供专门用于从事侵入网络、干扰网络正常功能及防护措施、窃取网络数据等危害网络安全活动的程序、工具；明知他人从事危害网络安全的活动的，不得为其提供技术支持、广告推广、支付结算等帮助。”，需要承担一定的行政责任。该法第63条对违反第27条还规定了具体的行政处罚措施，包括“没收违法所得”“拘留”“罚款”等处罚。同时，对违反27条规定受到处罚的相关人员也作出了任职限制规定。

此外，《数据安全管理办法（征求意见稿）》第16条对爬虫适用作出了限流规定：“网络运营者采取自动化手段访问收集网站数据，不得妨碍网站正常运行；此类行为严重影响网站运行，如自动化访问收集流量超过网站日均流量三分之一，网站要求停止自动化访问收集时，应当停止。”同时，第37条也规定了相应的行政责任：网络运营者违反相关规定的，由有关部门给予公开曝光、没收违法所得、暂停相关业务、停业整顿、关闭网站、吊销相关业务许可证或吊销营业执照等处罚。

三、数据爬取行为的合规指引

（一）严格规范数据爬取行为

1、如果目标网站有反爬取协议，应严格遵守网站设置的 Robots协议。Robots协议(也称为爬虫协议、机器人协议等)的全称是“网络爬虫排除标准”，网站通过Robots协议告诉搜索引擎哪些页面可以抓取，哪些页面不能抓取。该协议尊重信息提供者的意愿，并维护其隐私权;保护其使用者的个人信息和隐私不被侵犯。Robots协议代表一种契约精神，互联网企业只有遵守这一规则，才能保证网站及用户的隐私数据不被侵犯。可以说，无论从保护网民隐私还是尊重版权内容的角度，遵守robots协议都应该是正规互联网公司的默之举，任何违反robots协议的行为都应该为此付出代价。

2、合理限制抓取的内容。在设置抓取策略时，应注意编码禁止抓取视频、音乐等可能构成作品的、明确的著作权作品数据，或者针对某些特定网站批量抓取其中的用户生成内容；在使用、传播抓取到的信息时，应审查所抓取的内容，如发现属于用户的个人信息、隐私或者他人的商业秘密的，应及时停止并删除。对于内部系统数据，严格禁止侵入。

3、爬取行为不应妨碍网站的正常运行。企业应当合理控制爬取的频率，尽可能避免过于频繁地抓取数据，特别是如果超过了《数据安全管理办法（征求意见稿）》明确规定的“自动化访问收集流量超过网站日均流量三分之一”的要求，就应当严格遵守网站的要求，及时停止数据抓取。

（二）爬取个人信息时恪守合法、正当、必要原则

在我国，合法、正当、必要原则散见于《消费者权益保护法》、《网络安全法》、《全国人大常委会关于加强网络信息保护的决定》、《个人信息安全规范》等法律与规范之中。网络经营者拟爬取用户个人信息的，应当严格遵守上述法律法规的规定，以取得个人用户的事前同意为原则，避免超出用户的授权范围爬取信息。同样地，数据接受方也应当对以爬虫方式获取的他人信息进行合法性审查，了解个人信息主体是否同意共享个人信息数据。

（三）爬取商业数据时谨防构成不正当竞争

在数字内容领域，数据是内容产业的核心竞争资源，内容平台经过汇总分析处理后的数据往往具有极高的经济价值，因此非法爬取行为在某些具体应用场景下会被认定为构成不正当竞争。尤其是对于双方商业模式相同或近似、获取对方的信息会对对方造成直接损害的，企业应重点予以防范。如果存在此种情形，则应当谨慎使用爬取获取被爬取网站的数据。

四、结语

随着大数据时代的来临以及数字技术的蓬勃发展，数据的价值日益凸显，部分企业通过数据爬取技术更加高效地获取和深度地利用相关数据，从而弥补企业自身数据不足的现状，支撑企业的商业化发展。对于这些企业而言，“网络爬虫如何爬取信息数据才是合法的？”“爬取数据时如何做到合规？”是亟待解决的一大难题。作为法律工作者，应当从法律的专业角度给企业提供强有力的合规指引，为促进高新技术企业的发展，进而全面提升国家科技创新能力做出应有的贡献。

« 2023年7月 »
一	二	三	四	五	六	日
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30
31

黑客24小时在线接单网站

怎么联系真的黑客,24小时在线黑客联系方式,24小时在线联系黑客,正规黑客私人接单,黑客QQ联系方式