您当前位置:惠州维修 -> 其它类-> 网站制作-> HtmlCss教程 文章搜索:  
如何利用HTML页面中meta元素? - HtmlCss教程
作者:转载 来源:惠州维修 日期: 2006-11-20
放大字体显示 缩小字体显示 打印文章 推荐给朋友

1:假如说你的站点页面中有这么一句:

<META NAME="robots" CONTENT="index,follow">

你利用Nutch抓取并分析时,如何得到这个meta数值并处理呢?

2:你可以从HtmlParseFilter扩展出一个RobotsParserFilter,用下面的代码得到meta值:

Properties generalMetaTags = metaTags.getGeneralTags();
String robots = generalMetaTags.getProperty("robots");

3:增加这个值到metadata中:

parse.getData().getMetadata().put("robots", robots);

4: robots属性还可以再次从 metadata获取:

String robots2 = parse.getData().get("robots");

文章页数:[1] 
帮助你我他: 1.我有问题请教>>>  2.我有文章要发表>>>
版权申明:除部分特别声明不要转载,或者授权本站独家播发的文章外,大家可以自由转载本站的原创文章,但原作者和来自本站的链接必须保留(非本站原创的,按照原来自一节,自行链接)。文章版权归本站和作者共有。
转载要求:转载之图片、文件,链接请不要盗链到本站,且不准打上各自站点的水印,亦不能抹去本站水印。
特别注意:本站所有转载文章言论不代表本站观点,本站所提供的摄影照片,插画,设计作品,如需使用,请与原作者联系,版权归原作者所有。
发表评论  打印  刷新  推荐给朋友  返回顶部  关闭

网上大名: