德岛大学研究生院

技术科学研究部

任研究室

 

 

 

网络信息综合应用系统

信息采集模块

 

  采用目前较为流行的RSS协议进行新闻的采集,并根据各大新闻网站的特点,将新闻类别分为国内,国际,体育,金融等10类,在存储时,给每条新闻加入识别信息:题目,所属分类,加入时间,来源等。新闻采集源暂时采用国内几大新闻门户网站:新浪,千龙,人民日报等。采集后的数据采用MySql进行存储和管理,建立数据库服务器,通过web进行管理维护。系统构成如图2所示,

 

图2 信息采集系统构成图

  

 

基础模块:

|信息采集模块|自动文摘模块|

扩展模块:

|日语(中文信息)新闻网站|新闻摘要发布系统|热门人物&关键词追踪系统|面向小屏幕移动设备信息发布系统|2008奥运赛事问答系统|


A-1 Laboratory

 

 

 

Department of Information Science and Intelligent Systems, Faculty of Engineering at the University of Tokushima
yulei@is.tokushima-u.ac.jp

 

 

 

研究介绍

 

研究现状

 

研究成果

 

研究展望

 

首页