phome_enewsinfoclass 数据表字段解释(采集规则主表) |
字段名 | 类型 | 解释 | 附加说明 |
classid | int(11) | 节点ID | |
bclassid | int(11) | 父节点ID | |
classname | varchar(100) | 节点名称 | |
infourl | mediumtext | 采集页面地址 | 多个地址用回车隔开 |
newsclassid | smallint(6) | 入库栏目ID | |
startday | date | 开始时间 | |
endday | date | 结束时间 | |
bz | text | 备注 | |
num | smallint(6) | 采集记录数 | |
copyimg | tinyint(1) | 远程保存图片到本地 | 1为开启,0为关闭 |
renum | smallint(6) | 每组信息采集个数 | |
keyboard | text | 包含采集关键字限制 | |
oldword | text | 内容替换原字符 | |
newword | text | 内容替换新字符 | |
titlelen | smallint(6) | 不采集标题相似超过字数 | |
retitlewriter | tinyint(1) | 不采集标题相同的信息 | 1为限制,0为不限制 |
smalltextlen | smallint(6) | 截取内容简介字数 | |
zz_smallurl | text | 信息链接区域正则 | |
zz_newsurl | text | 信息页链接正则 | |
httpurl | varchar(255) | 内容页地址前缀 | |
repad | text | 过滤广告正则 | |
imgurl | varchar(255) | 图片/FLASH地址前缀 | |
relistnum | smallint(6) | 每组列表采集个数 | |
zz_titlepicl | text | 列表页标题图片正则 | |
z_titlepicl | varchar(255) | 列表页标题图片预定义值 | |
qz_titlepicl | varchar(255) | 列表页标题图片地址前缀 | |
save_titlepicl | varchar(10) | 列表页标题图片远程保存 | |
keynum | tinyint(4) | 关键字截取标题字数 | |
insertnum | smallint(6) | 每组入库数 | |
copyflash | tinyint(1) | 远程保存FLASH到本地 | 1为开启,0为关闭 |
tid | smallint(6) | 数据表ID | |
tbname | varchar(60) | 数据表名 | |
pagetype | tinyint(1) | 分页形式 | 0为上下页导航式,1为全部列出式 |
smallpagezz | text | 分页区域正则(上下页式) | |
pagezz | text | 分页链接正则(上下页式) | |
smallpageallzz | text | 分页区域正则(全部列出) | |
pageallzz | text | 分页链接正则(全部列出) | |
mark | tinyint(1) | 图片加水印 | 1为开启,0为关闭 |
enpagecode | tinyint(1) | 页面编码转换 | 0为不转码 |
recjtheurl | tinyint(1) | 是否重复采集同一链接 | 1为重复采集,0为不重复采集 |
hiddenload | tinyint(1) | 是否隐藏已导入的信息 | 0为不显示,1为显示 |
justloadin | tinyint(1) | 采集后是否自动入库 | 1为开启,0为关闭 |
justloadcheck | tinyint(1) | 自动入库是否直接审核 | 1为审核通过,0为需审核 |
delloadinfo | tinyint(1) | 入库后是否删除已导入的记录 | 1为开启,0为关闭 |
pagerepad | mediumtext | 整体页面过滤正则 | |
newsztid | text | 入库专题ID | 多个专题ID用“|”隔开,例如:|1|5| |
getfirstpic | tinyint(4) | 提取第几张图片为标题图片 | |
oldpagerep | text | 整体页面替换原字符 | |
newpagerep | text | 整体页面替换新字符 | |
keeptime | smallint(6) | 每组采集时间间隔 | |
lasttime | int(11) | 最后采集时间 | unix时间戳 |
newstextisnull | tinyint(1) | 内容为空不采集 | 1为开启,0为关闭 |
getfirstspic | tinyint(1) | 提取标题图片生成缩略图 | 1为开启,0为关闭 |
getfirstspicw | smallint(6) | 提取标题图片生成缩略图宽度 | |
getfirstspich | smallint(6) | 提取标题图片生成缩略图高度 | |
doaddtextpage | tinyint(1) | 入库是否保留原分页 | 0为保留分页,1为不保留分页 |
infourlispage | tinyint(1) | 采集页面为直接内容页 | 1为是,0为否 |