书源制作教程 您所在的位置:网站首页 app书源制作教程 书源制作教程

书源制作教程

2023-12-21 22:52| 来源: 网络整理| 查看: 265

从2.18.120813开始增加了新的规则写法

支持XPath语法,以@XPath:开头,语法见 http://www.w3school.com.cn/xpath/index.asp

XPath语法测试 http://www.bejson.com/testtools/xpath/ 写书源时可用

支持JSonPath语法,以@JSon:开头,语法见 https://blog.csdn.net/koflance/article/details/63262484

JsonPath获取字符支持此种写法xxx{$._id}yyy{$.chapter}zzz

JSonPath语法测试 http://jsonpath.herokuapp.com 写书源时可用

支持用js处理结果,以@js:开头,结果变量为result 如 "@JSon:$.link@js:"http://chapterup.zhuishushenqi.com/chapter/" + encodeURIComponent(result)"

注意 JSon的值如果不是String,用js处理时需自己进行类型转换

注意 #替换规则在新语法下无法使用,新的语法用js处理结果,

原有的规则不变,见下方

书源规则说明

书源规则基于HTML标记,如class,id,tag等

想要写规则先要打开网页源代码,在里面找到想要获取内容对应的标签,

Chrome可以在网页上右击点击检查可以方便的查看标签

基本写法

@为分隔符,用来分隔获取规则

每段规则可分为3段

第一段是类型,如class,id,tag,text,children等, children获取所有子标签,不需要第二段和第三段,text可以根据文本内容获取

第二段是名称,text. 第二段为文本内容的一部分

第三段是位置,class,tag会获取到多个,所以要加位置,id类型不要加

如不加位置会获取所有

位置正数从0开始,0是第一个,如为负数则是取倒数的值,-1为最倒数第一个,-2为倒数第二个

!是排除,有些位置不符合需要排除用!,后面的序号用:隔开0是第1个,负数为倒数序号,-1最后一个,-2倒数第2个,依次

获取列表的最前面加上负号- 可以使列表倒置,有些网站目录列表是倒的,前面加个负号可变为正的

@的最后一段为获取内容,如text,textNodes,href,src,html等

如果有不同网页的规则可以用 | 或 & 分隔 或 %

|会以第一个取到值的为准,

& 会合并所有规则取到的值,

% 会依次取数,如三个列表,先取列表1的第一个,再取列表2的第一个,再取列表3的第一个,再取列表1的第2个.......

如需要正则替换在最后加上 #正则表达式#替换为

例:[email protected]@text|[email protected]@text#全文阅读

例:[email protected]@[email protected]@text#全文阅读

BookSourceUrl 书源网址

BookSourceName 书源名称

BookSourceGroup 书源分组

RuleSearchUrl 搜索网址

例:http://www.gxwztv.com/search.htm?keyword=searchKey&pn=searchPage-1

?为get @为post

searchKey为关键字标识,运行时会替换为搜索关键字,

searchPage,searchPage-1为搜索页数,从0开始的用searchPage-1,

page规则还可以写成{index(第一页), indexSecond(第二页), indexThird(第三页), index-searchPage+1 或 index-searchPage-1 或 index-searchPage}

要添加转码编码在最后加 |char=gbk

|char=escape 会模拟js escape方法进行编码

ruleFindUrl 发现规则

发现规则分为两段,名称和url用::分开,如

起点风云榜::https://www.qidian.com/rank/yuepiao?page=searchPage

url规则和搜索规则一样,多个规则用&&或换行分开,如

起点风云榜::https://www.qidian.com/rank/yuepiao?page=searchPage&&原创风云榜::https://www.qidian.com/rank/yuepiao?style=1&page=searchPage

也可以每行写一个,域名可以省略,如省略会调用书源域名

起点风云榜::/rank/yuepiao?page=searchPage

原创风云榜::/rank/yuepiao?style=1&page=searchPage

RuleSearchList 搜索列表

例:class.list-group-item!0:%

RuleSearchAuthor 搜索里的作者

例:class.col-xs-2.0@text

RuleSearchKind 搜索里的类型

例:class.col-xs-1.0@text

RuleSearchLastChapter 搜索里的最新章节

例:[email protected]@text

RuleSearchName 获取搜索里的书名

例:[email protected]@text

RuleSearchNoteUrl 搜索里的书链接

例:[email protected]@href

RuleSearchCoverUrl 搜索里的书封面

例:tag.img.0@src

RuleBookUrlPattern 书籍页面里的URL正则

例:https?://www.piaotian.com/bookinfo/.*"

RuleBookName 书籍页面里的书名称

例:class.active.0@text

RuleBookAuthor 书籍页面里的作者

例:[email protected]@text

RuleIntroduce 书籍页面里的简介

例:class.panel panel-default [email protected]@text

RuleCoverUrl 书籍页面里的封面

例:[email protected]@src

RuleBookKind 书籍页面里的分类

例:[email protected]@text#.*:

RuleBookLastChapter 书籍页面里的最新章节

[email protected]@tag.a@text

RuleChapterUrl 书籍页面里的目录地址

如果目录地址和书籍地址一样则留空

例:class.list-group-item [email protected]@href

RuleChapterUrlNext 目录页面里的下一页目录地址

如果没有下一页则留空

例:class.page.0@text.下一页.0@href 也可以获取所有目录页url的列表,会依次获取

例:[email protected]@href (class.chapter.0)里包含第1页第2页第三页等

RuleChapterList 目录页面的目录列表

前面加 - 号倒序排列

例:[email protected]

例:[email protected]

RuleChapterName 目录列表的章节名称

例:text

RuleContentUrl 目录列表的章节链接

例:href

RuleBookContent 章节内容

例:id.txtContent@textNodes

如需获取AJAX动态内容前面加$

例:$id.txtContent@textNodes

下面是最新的书源模板

{ "bookSourceGroup": "书源分组",   "bookSourceName": "书源名称",  "bookSourceUrl": "书源URL",   "enable": true,  "httpUserAgent": "httpuseragent", "loginUrl": "登陆URL", "ruleBookAuthor": "作者规则", "ruleBookContent": "正文规则", "ruleBookKind": "分类规则", "ruleBookLastChapter": "最新章节规则", "ruleBookName": "书名规则", "ruleBookUrlPattern": "书籍详情URL正则", "ruleChapterList": "目录列表规则", "ruleChapterName": "章节名称规则", "ruleChapterUrl": "目录URL规则", "ruleChapterUrlNext": "目录下一页规则", "ruleContentUrl": "章节URL规则", "ruleContentUrlNext": "正文下一页URL规则", "ruleCoverUrl": "封面规则", "ruleFindUrl": "发现规则", "ruleIntroduce": "简介规则", "ruleSearchAuthor": "搜索结果作者规则", "ruleSearchCoverUrl": "搜索结果封面规则", "ruleSearchKind": "搜索结果分类规则", "ruleSearchLastChapter": "搜索结果最新章节规则", "ruleSearchList": "搜索结果列表规则", "ruleSearchName": "搜索结果书名规则", "ruleSearchNoteUrl": "搜索结果书籍URL规则", "ruleSearchUrl": "搜索地址", "serialNumber": 0, "weight": 0 }



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有