WebMagic 0.7.3 最新版

大小：13.41 MB

语言：简体中文系统：WinAll, Win7, Win10

类别：编程工具时间：2017-07-31 15:32

本地普通下载

请输入预约的手机号码

669人已预约此游戏

确定取消

WebMagic中文版是java上面经常的需要的一款爬虫类型的工具，现在就可以试试最新的0.7.3版本，功能以及使用上面都是完全的免费的，欢迎大家下载使用！

中文版功能

WebMagic是一个简单灵活的Java爬虫框架。基于WebMagic，你可以快速开发出一个高效、易维护的爬虫。webmagic采用完全模块化的设计，功能覆盖整个爬虫的生命周期(链接提取、页面下载、内容抽取、持久化)，支持多线程抓取，分布式抓取，并支持自动重试、自定义UA/cookie等功能。

常见问题

（1）由于我这个爬虫的抓取有分页，而且它的分页通过js跳转的，抽取出来感觉有点麻烦，我想直接得到所有的信息，发现可以通过输入url地址请求得到所有的信息（这是网站的一个小问题，它没有设置每页数据记录条数的范围），但是需要登录才可以进行url地址的访问，就要使用cookie模拟登录。

（2）下面分析有关登录信息的cookie，我使用的是chrome，点击如图位置，会看到此网站的cookie，（如果已经访问了一段时间了，可以清除所有cookie然后重新登录再访问，否则可能会有很多的cookie，分析起来不方便），由于只有5个cookie，直接加上就可以访问了

WebMagic 0.7.3更新内容

本次更新增加了Downloader模块的一些功能。

#609 修复HttpRequestBody没有默认构造函数导致无法反序列化的bug。

#631 HttpRequestBody的静态构造函数不再抛出UnsupportedEncodingException受检异常。

#571 Page对象增加bytes属性，用于获取二进制数据。下载纯二进制页面时，请设置request.setBinarayContent(true)，这样对于二进制内容不会尝试转换为String，减小开销。

#629 在HttpUriRequestConverter中会自动对一些导致URI异常的字符进行转移或过滤。

#610 自动识别编码时，可以识别Content-Type中charset为大写的情况。

#627 支持为Request单独设置页面编码，兼容同一站点多种编码方式的情况。

#613 Page对象增加charset属性，其值为request/site中设置的charset，或者为自动检测的charset(未定义时)。

#606 升级jsonpath到2.4.0

∨ 展开

权限须知：查看
需要调用以下重要权限关闭
允许应用程序更改任务的Z顺序

需要能够访问摄像机装置

允许应用程序打开网络套接字

允许程序访问有关网络的信息

允许只读到电话状态访问，包括该装置的电话号码，当前蜂窝网络信息，任何正在进行的呼叫的状态，并且任何一个列表 PhoneAccount的注册在设备上

允许应用程序写入到外部存储器

允许应用程序从外部存储读取

允许使用PowerManager WakeLocks让处理器进入休眠或屏幕变暗

允许安装和可移动存储卸载文件系统

允许应用程序访问Wi-Fi网络的信息

允许应用程序读取或写入系统设置

允许应用程序访问的大致位置

允许应用访问精确位置

允许应用程序更改Wi-Fi连接状态

允许应用程序访问额外的位置提供程序命令

特别下载

UEStudio 19中文版编程工具194 MB19.20.0.45
进入
Crossover19 For Mac编程工具243 MB19.0
进入
VS2019中文旗舰版编程工具1.27 MB2.0
进入
WebStorm 2018.3.5中文版编程工具216 MB
进入
RapidWeaver 8 Mac破解编程工具74.69 MB8.1.6
进入
Vim插件 for Mac编程工具14.81 MB8.1.280
进入
Java SE Development Kit 9编程工具357.09 MB9.0.4
进入
Eclipse Mars编程工具47 MB4.5.1
进入

猜你喜欢

相关文章

javascript void 0 网页打不开解决方法

热门推荐

下载排行

1Visual studio code Mac版202 MB
2eclipse汉化语言包88.1 MB
3Visual Studio 2010 旗舰版2.5 GB
4Visual Studio 2015中文企业版3.9 GB
5Microsoft Visual Studio 20221.61 MB
6PhpStorm 2022416.25 MB
7IntelliJ IDEA 2019.3.1破解（附破解补丁）673.4 MB
8Adobe Dreamweaver CC 2019中文版219 MB
9Android Studio NDK Windows810.37 MB
10ATOM编辑器 64位147 MB

网友评论

我要跟帖

查看所有评论共 0 条