德岛大学研究生院
技术科学研究部
任研究室
网络信息综合应用系统
信息采集模块
采用目前较为流行的RSS协议进行新闻的采集,并根据各大新闻网站的特点,将新闻类别分为国内,国际,体育,金融等10类,在存储时,给每条新闻加入识别信息:题目,所属分类,加入时间,来源等。新闻采集源暂时采用国内几大新闻门户网站:新浪,千龙,人民日报等。采集后的数据采用MySql进行存储和管理,建立数据库服务器,通过web进行管理维护。系统构成如图2所示,
图2 信息采集系统构成图
基础模块:
|信息采集模块|自动文摘模块|
扩展模块:
|日语(中文信息)新闻网站|新闻摘要发布系统|热门人物&关键词追踪系统|面向小屏幕移动设备信息发布系统|2008奥运赛事问答系统|
A-1 Laboratory
Department of Information Science and Intelligent Systems, Faculty of Engineering at the University of Tokushima yulei@is.tokushima-u.ac.jp
研究介绍
研究现状
研究成果
研究展望
首页