最新消息:资源整合

标签:Jsoup

Jsoup代码解读(3):Document的输出
基础技术

Jsoup代码解读(3):Document的输出

admin 1个月前 (02-12) 7浏览

原文出处: 黄亿华 Jsoup官方说明里,一个重要的功能就是output tidy HTML。这里我们看看Jsoup是如何输出HTML的。 HTML相关知识 分析代码前,我们不妨先想想,“tidy HTML”到底包括哪些东西: 换行,块级标签习...

Jsoup代码解读(8):防御XSS攻击
基础技术

Jsoup代码解读(8):防御XSS攻击

admin 2个月前 (01-26) 14浏览

原文出处: 黄亿华 防御XSS攻击的一般原理 cleaner是Jsoup的重要功能之一,我们常用它来进行富文本输入中的XSS防御。 我们知道,XSS攻击的一般方式是,通过在页面输入中嵌入一段恶意脚本,对输出时的DOM结构进行修改,从而达到执行这段...

Jsoup代码解读(2):DOM相关对象
基础技术

Jsoup代码解读(2):DOM相关对象

admin 4个月前 (11-25) 8浏览

原文出处: 黄亿华 DOM结构相关类 我们先来看看nodes包的类图: 这里可以看到,核心无疑是Node类。 Node类是一个抽象类,它代表DOM树中的一个节点,它包含: 父节点parentNode以及子节点childNodes的引用 属性值...

Java上的jQuery?解析HTML利器—Jsoup
基础技术

Java上的jQuery?解析HTML利器—Jsoup

admin 4个月前 (11-19) 4浏览

原文出处: 吴纹羽 也许大家有过在java运行平台上解析html的经历,通常的方式是将HTML以XML的形式进行结点解析,调用java本身的xml解析类库。这样的方式很容易理解并且很方便,但习惯用jQuery的各位是否在感叹能否在java中像jQ...

Jsoup代码解读(1):概述
基础技术

Jsoup代码解读(1):概述

admin 4个月前 (11-16) 8浏览

原文出处: 黄亿华 今天看到一个用python写的抽取正文的东东,美滋滋的用Java实现了一番,放到了webmagic里,然后发现Jsoup里已经有了…觉得自己各种不靠谱啊!算了,静下心来学学好东西吧! Jsoup是Java世界用作html解析和...

Jsoup代码解读(5):parser(中)
基础技术

Jsoup代码解读(5):parser(中)

admin 5个月前 (10-29) 12浏览

原文出处: 黄亿华 代码结构 先介绍以下parser包里的主要类: Parser Jsoup parser的入口facade,封装了常用的parse静态方法。可以设置maxErrors,用于收集错误记录,默认是0,即不收集。与之相关的类有Pa...

Jsoup代码解读(4):parser(上)
基础技术

Jsoup代码解读(4):parser(上)

admin 6个月前 (09-27) 10浏览

原文出处: 黄亿华 作为Java世界最好的HTML 解析库,Jsoup的parser实现非常具有代表性。这部分也是Jsoup最复杂的部分,需要一些数据结构、状态机乃至编译器的知识。好在HTML语法不复杂,解析只是到DOM树为止,所以作为编译器入门...

Jsoup代码解读(6):parser(下)
基础技术

Jsoup代码解读(6):parser(下)

admin 6个月前 (09-13) 11浏览

原文出处: 黄亿华 最近生活上有点忙,女儿老是半夜不睡,精神状态也不是很好。工作上的事情也谈不上顺心,有很多想法但是没有几个被认可,有些事情也不是说代码写得好就行的。算了,还是端正态度,毕竟资历尚浅,我还是继续我的。 读Jsoup源码并非无聊,目...