<iframe align="center" marginwidth="0" marginheight="0" src="http://www.zealware.com/csdnblog336280.html" frameborder="0" width="336" scrolling="no" height="280"></iframe>
机器人的“Blog Network”
他的blog后面列出了自己手动生成的主题阅读列表:
其实延展阅读这类东西或者“中文博客在讨论什么”这块,可以用机器自行计算出来,不需要有什么“关键词”来作为第一推动力,就可以计算出来热点。
这么出来的东西,不就是机器人的“Blog Network”吗?
[ “内容引擎”能够通过对数万乃至数十万篇博文进行分析后,自动算出许多组博文,每一组博文都有很高的内聚性。我们可以认为这一组博文代表了一个中文世界的热点讨论。
百度、Google是通过用户搜索输入的关键词来判断中文世界的热点。而我们通过分析博客们写作的数十万篇博文来寻找热点的。通过这种主题自动发现技术,可以很容易知道最近中文世界人们在讨论什么、在关注什么。而不需要任何人为的输入关键词来做第一推动力。
譬如说,如下所示的热点组:
-----------主题245------------------
核心文档:(index=11646507.xml)新快报:韩国人发明汉字
index=11645945.xml title=如何拯救我们的文化?
index=11645979.xml title=看看韩国对中国犯的七宗罪(随时更新)
index=11647900.xml title=汉字真是韩国人发明的又能怎样(图)
index=11651176.xml title=韩国人为什么敢意淫汉字?
index=11654537.xml title=韩国人疯了宣称“汉字是古代韩国人发明的”!
-----------主题246------------------
核心文档:(index=11646015.xml)财经新闻报道的创新
index=11645987.xml title=财经新闻与“利益”视角――财经报道心得点滴谈
index=11646003.xml title=我们怎么写财经新闻
index=11646009.xml title=美国华人记者看中国财经报纸――《华尔街日报》成长的启示
index=11646031.xml title=国外财经媒体的启示:大众化还是专业化
index=11646037.xml title=需要财经大视野――新形势下经济报道的新特点分析
可以表明人们在讨论两个热点:“韩国人是否发明了汉字的争论”和“财经新闻如何制作的分析”。
目前,这种计算将会每天计算一次。未来希望能够半天计算一次,这就对爬虫速度以及热点计算速度提出了很高的要求。
]
["上面的热点讨论是系统每隔四小时自动生成的中文博客世界的热点讨论之一。内容引擎可以自行计算出热点,当然也可以允许用户输入中心词或者中心文章来个性化计算热点。"]
"想知道在最近三小时内中文博客们在热烈讨论什么吗?"
那就看我们的“Most Popular”频道吧。
Technorati.com依靠url链接来计算最流行的热点排行榜(Most Popular: http://www.technorati.com/pop/),在中国不可能完全根据链接计算热点,只能靠语义。
<script type="text/javascript">insitu_init_page_photos_user_description_div('293070972');</script>
早先的swordi这篇blog也谈到了类似的意思不过提到的这些都是人手动作的专题并且人有意识提取在先。其实机器可以自己去发现去整理。
{
http://swordi.com/2006/11/04<wbr></wbr>/editor20-cnbloggercon-blog<wbr></wbr>-media/
看起来Technorati.com在中国大陆是无法访问了:( 国内的Souyo.com有些差强人意,收录Post的速度滞后很严重,在杭州参加中文网志年会的第二天访问 Souyo.com开设的中文网志年会的专题页面,发现没有新鲜的内容。
今年有许多人在做手工编辑的网志年会内容聚合,例如博客报的Blo<wbr></wbr>gsir就不断在Update这个《2006中文网志年会后续报道列表总汇》,虽然不是完整收录,但是手工编辑挑选,也算是弥补了一个Tec<wbr></wbr>hnorati缺席,Souyo滞后的遗憾。
这个简单的体验,也说明Blog的发展在2006<wbr></wbr>-2007将迈向一个新的阶段,在许多人近期的讨论<wbr></wbr>、交流以及贴子上也可以看到端倪,那就是Blog内容的聚合<wbr></wbr>、整理、再编辑、再发布。Douban.com的阿北在年会说Douban.com将推出"Blogger推荐",i.Blogbeta.com <script type="text/javascript"><!--D(["mb","和<a href/u003d/"http://www.bokeebao.com//" target/u003d/"_blank/" onclick/u003d/"return top.js.OpenExtLink(window,event,this)/">/n<font color/u003d/"#feac00/">Bokeebao.com</font></a>这一类型的Blog媒体开始越来越多。而Blogbus这个专业的<WBR>BSP也在近期推出了"频道"这个新功能,让Blogger举荐p<WBR>ost,聚合成频道,Royal在《<a href/u003d/"http://www.royalshi.com/archives/248//" target/u003d/"_blank/" onclick/u003d/"return top.js.OpenExtLink(window,event,this)/"><font color/u003d/"#feac00/">Blogbus转身</font></a>》这篇贴子里对这件事情做了如下的评论:/n</p>/n<blockquote>/n<p><span><font size/u003d/"2/">BSP</font></span>从blog内容的存储到内容的再组织再利用,似乎是顺理成章的事<WBR>,BlogBus这次转身,轨迹也不难想象……<a href/u003d/"http://pindao.blogbus.com/submit.jsp/" target/u003d/"_blank/" onclick/u003d/"return top.js.OpenExtLink(window,event,this)/"><font color/u003d/"#feac00/">频道内容推荐</font></a>有个好听的名字:"点亮你我的blog",/n算是颇有2.0特色的功能,用户推荐分享并且消费用户贡献的内容,只要有相应的手段制止作恶<WBR>,生态平衡还是容易维持的……</p></blockquote>/n<p>小容相信编辑2.0的时代已经来临。<strong><font color/u003d/"#ff0000/" size/u003d/"4/">在2007年,中文Blogosphere将有更多的自己写内容的<WBR>Blogger开始变成编辑,他们将专注于小而窄的领域<WBR>,在RSS聚合工具等Blog内容聚合工具的帮助下<WBR>,及时地用Blog的形式报道信息,整理和聚合话题。</font></strong>这些Blogger与1.0的新闻门户网站的编辑相比,更娴熟于掌握Blog工具的使用、Blog的传播<WBR>、Blog的内容挖掘。/n</p>/n<p>今天晚上小容将参加<a href/u003d/"http://www.fjitren.com/blog/post/etalkfuzhou001.html/" target/u003d/"_blank/" onclick/u003d/"return top.js.OpenExtLink(window,event,this)/"><font color/u003d/"#feac00/">福州网络创业沙龙(eTalk Fuzhou Salon)的第一期活动</font></a>,小容将和福州本地的朋友分享关于《Blog及其商业化》的话题。这个编辑2.0的话题也将是议题的一部分。 </p></div></div>
</div>
<div class="share_buttons" id="sharePanel"></div>
<div class="article_next_prev">
<li class="prev_article">
<span>上一篇:</span><a href="http://blog.csdn.net/huangkelong/article/details/2285554"> 冷静·叶荣添·定力</a></li>
<li class="next_article">
<span>下一篇:</span><a href="http://blog.csdn.net/huangkelong/article/details/2285567"> 《职场》笔记20061112</a></li>
</div>
</div>
<div id="ad_cen"></div>
<script type="text/javascript">
new Ad(4, 'ad_cen');
</script>
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
<script type="text/javascript">
var fileName = '2285557';
var commentscount = 0;
var islock = false
</script><script type="text/javascript" src="http://static.blog.csdn.net/scripts/comment.js"></script>
<script type="text/javascript">
new Ad(5, 'ad_bot');
</script>
huangkelong
- 访问:125686次
- 积分:32280分
- 排名:第23名
- 原创:3174篇
- 转载:0篇
- 译文:0篇
- 评论:19条
<script type="text/javascript" src="http://static.blog.csdn.net/scripts/ad.js"></script><script type="text/javascript">
new Ad(12, 'ad_commend');
</script>
分享到:
相关推荐
基于ADAMS和MATLAB的四足机器人联合仿真 基于ADAMS和MATLAB的四足机器人联合仿真 基于ADAMS和MATLAB的四足机器人联合仿真 基于ADAMS和MATLAB的四足机器人联合仿真 基于ADAMS和MATLAB的四足机器人联合仿真 基于ADAMS...
关于消毒机器人的介绍和解析 ...关于消毒机器人的介绍和解析关于消毒机器人的介绍和解析关于消毒机器人的介绍和解析关于消毒机器人的介绍和解析关于消毒机器人的介绍和解析关于消毒机器人的介绍和解析关于消
机器人框架源码支持频道编译可用易语言
Fanuc机器人IO配置和UIUO配置[汇编].pdf
机器人建模和控制.pdf
自适应机器人交互和机器人开放平台.pdf
FANUC机器人_CRX协作机器人的开机和示教器的初始化设置基本步骤
邮件机器人邮件机器人邮件机器人邮件机器人
ABB 机器人的欧拉角和四元数转化工具,运行于win7 32位以下, 不支持 64位
什么是机器人的自由度和工作空间? 什么是机器人的操作机?分为哪几部分? 工业机器人和智能机器人的定义: 工业机器人四大家族 什么是工业机器人的定位精度,什么是重复定位精度? 什么是机器人的换接器?有何作用...
机器人仿真和实体机器人校准的方法,校准后可将离线编程程序直接用于真实的机器人,提高效率 适用于FANUC发那科机器人软件ROBOGUIDE,其它机器人可参考
KUKA机器人修改机器人名称和IP地址的具体方法示例
机器人技术公共选修课:第8讲 机器人轨迹规划和生成.pdf
用C#写的上位机,来和kuka机器人进行TCP通讯,获取点位和文件传输
工业机器人机械结构设计及分析相关学习资料
机器人教程种子,可以迅雷下载,机器人教程种子,可以迅雷下载,机器人教程种子,可以迅雷下载,机器人教程种子,可以迅雷下载,
邮件机器人1邮件机器人1邮件机器人1邮件机器人1邮件机器人1邮件机器人1
最全的ABB机器人手册资料汇总,包括以下内容: 一、ABB常用说明书中文版 集成视觉应用手册 系统参数 协同动作应用手册 指令功能数据 RAPID语言概览 RAPID语言内核 RS操作手册 二、ABB机器人编程及指令手册 ABB常用...
语音控制机器人是一体的硬件和云解决方案。主要组成部分是: 1. Alexa Skill - 解释语音命令并将其转换为 Google Cloud Messaging 消息 - 部署到 Heroku 云 2. Android 应用程 序- 从 Google Cloud Messaging 接收...
工业机器人离线编程与仿真(FANUC机器人)课程教案.docx工业机器人离线编程与仿真(FANUC机器人)课程教案.docx工业机器人离线编程与仿真(FANUC机器人)课程教案.docx工业机器人离线编程与仿真(FANUC机器人)课程教案.docx...