Design and Implementation of Sina Weibo Earthquake Public Opinion Database
-
摘要: 社交媒体地震舆情数据可实时反映灾区现状,为震后应急提供较好的地震灾情舆情研判服务。选取新浪微博作为数据源,对接EQIM,采用新浪微博开放平台API与分布式网络爬虫相结合的方式获取地震舆情数据。在数据清洗和基于fastText地震相关性分类模型进行数据预处理的基础上,应用MySQL关系型数据库,设计并实现我国大陆地区准实时新浪微博地震舆情数据库及管理平台。现阶段,该数据库收集了2021年1月1日至2022年3月31日我国大陆地区3.0级及以上地震447次、地震舆情数据732 949条,实现数据下载、快速查询及精确查询,方便数据查询与管理,有助于震后舆情监控与灾情快速获取。Abstract: Social media earthquake public opinion data reflect the current situation of the disaster area in real time, and provide a better service of earthquake disaster public opinion evaluation for post-earthquake emergency response.In this paper, selecting Sina Weibo as the data source and connecting EQIM, the combination of Weibo API interface and distributed web crawler is used to obtain earthquake public opinion data.On the basis of data cleaning and data preprocessing based on fastText seismic correlation classification model, using MySQL relational database,we design and achieve the quasi real-time Sina Weibo earthquake public opinion database and database management platform in mainland China area.At present, the database has collected 447 earthquakes with MS3.0 or above in mainland China from January 1, 2021 to March 31, 2022, and 732 949 earthquake public opinion data. It lays a foundation for social media earthquake public opinion data mining and analysis research.
-
Key words:
- Database /
- Earthquake emergency /
- Network public opinion /
- Social media /
- Sina Weibo
-
引言
随着“九五”前兆数字化改造、“十五”网络项目、前兆数据共享项目、“九五”接入改造和历史数据迁移等项目的实施,各区域前兆Oracle数据库积累了自1980年以来丰富的数据资料。这些资料包括:① 台站信息,涉及台站勘选信息、地震地质条件、地址等信息;② 观测数据,目前数据库中不仅拥有1980年以来的模拟、人工等历史观测数据,还包括“九五”、“十五”数字化等高采样率观测资料;③ 测项、测点信息,不同测项的基本信息以及各测点的具体情况等;④ 日志资料,各省级数据库中包括台站人员处理资料时的预处理日志,以及该省局前兆台网和所属台站每天的工作日志;⑤ 场地信息,前兆数据库还储存有各学科测项的场地基础信息,如流体井泉、形变洞体、跨断层形变观测场地、地磁台站观测环境、地电场地以及电极布设信息等。以上前兆观测资料都集中在同一套数据库中(周克昌等,2010)。
区域前兆台网中心每天值班的工作任务繁重,重复劳动多,每月、每年要对观测数据质量进行各种统计。如何减少人工操作,增大自动化程度,是一个迫切需要解决的问题。目前,常用的前兆工作相关软件或平台有:① 数据预处理软件(集成版、学科版),主要用于处理前兆各测项收集到的原始数据,填写观测日志等;② 地震分析预报系统(MapSIS)和地震前兆信息处理与软件系统(EIS2000),主要用于绘制数据时序图,可下载数据库中已有的数据并进行一些分析应用(陆远忠等,2002;蒋骏等,2000);③ 数据管理系统,用于数据采集、监视台站管理系统软、硬件和台站观测设备运行状态以及工作日志上报等(周克昌等,2006;王建国等,2013);④ 前兆跟踪分析软件,主要关注数据质量,异常跟踪分析。上述各软件功能并不能够对区域中心的基础信息进行系统的分类统计,也不具备自动化值班和异常信息报警等功能。
基于前兆数据库使用现状,本研究首先对台站工作人员、前兆台网工作人员和预报工作人员进行了前兆数据的需求分析,然后针对不同使用者梳理出清晰的数据调用方式,最终建立一套基于B/S架构的区域前兆数据库信息服务与运行管理平台,使台站人员能够更方便地查看台站基础资料,检查各项日志是否填写正确;预报人员方便地查阅台站联系方式、台站的基础资料、测项信息、观测日志等;前兆台网工作人员缩短每天的值班时间,有效快捷地统计各类报表,提高值班自动化水平。
1. 需求分析与平台设计
1.1 不同类型用户的需求分析
目前,区域地震前兆数据库使用较频繁的人员主要有:① 本区域台站工作人员。台站收集的数据每天需及时提交到区域中心的前兆数据库,台站工作人员每天对本台数据进行处理之后,需填写观测日志,并且上报工作日志,还需及时将本台站更新过的基础信息上传至数据库中。台站工作人员与前兆数据库的关系是最基础、最密切的,数据库里的台站资料是否真实、正确,关系到整个区域前兆台网的运行状态。② 区域地震前兆台网中心工作人员。区域中心值班的工作人员每天需检查数据库中前一天的数据质量及台站工作情况,并确保台站的基础信息完全正确。每月的运行月报、跟踪分析月报都需要对数据库中的数据进行梳理和总结,填写相关的统计报表。每年的运行年报、跟踪分析年报也需要对全年的前兆工作进行总结,涉及仪器的基础信息、测项的基础信息、观测数据统计等十几张表格,工作内容繁重。以上工作完全依靠人工完成,相当费时费力。减少区域前兆台网中心工作人员的工作量,尤其是对中等规模以上台网实现自动化值班能更有效地提高工作效率,对解决区域前兆台网中心人员不足等问题具有重要意义。③ 省局预报人员。省局预报人员每周会商前都会查看全省前兆数据的观测日志以及相关台站的工作日志,对落实异常进行最基本的检查工作。另外,省局预报人员也需要了解台站、测点、仪器的基本情况,对数据的变化有一个背景认识。
基于以上分析,我们认为,该项研究需解决不同类型用户的实际工作需求,简化工作流程。通过逻辑条理清晰的设计思路,让台站人员和预报人员能够方便快捷地查看他们所关心的内容,让前兆台网中心工作人员能够简化值班的重复性工作,节约统计时间,提高工作效率。
1.2 管理平台设计
通过梳理数据库中的数据以及对目标用户的需求分析,我们设计了一套可实现自由查询测项、快捷浏览日志及各类基础信息、用观测数据自动绘图并判定异常和报警(张兴国等,2011)、自动统计观测数据起止时间及数据的连续完整率、自动统计仪器运行率等功能的区域前兆数据库信息服务与运行管理平台(图 1)。
根据数据库结构分析、软件架构设计等确定了数据库表的结构,保证其符合中国地震局前兆台网数据库结构规范要求。设计的数据库信息服务及运行管理平台架构采用MVC架构,采用HIBERNATE和STRUTS 2框架开发。由于实现B/S架构(Browser/Server)系统功能的核心部分集中在服务器上,客户端只需安装浏览器即可。同时,该平台维护和升级方式简单、成本低,将其用于前兆数据库的数据检索和数据统计,时效性较好。
2. 管理平台主要功能
2.1 测项查询
测项查询仅在用户登录后才可查看,包括按台站查询(图 2)、按学科查询和全部测项查询,显示各测项的台站名称、仪器名称及型号、测点编码、仪器ID、采样率、测项代码、所属学科、开始观测时间等信息。
为了方便使用不同方式查询,可根据需要从台站为切入点,查询某一测点的测项资料,亦可从学科开始查询某一种仪器的测项资料,或是根据统计分析资料导出所有测项数据。
2.2 日志查询
日志查询由3部分组成:工作日志查询、观测日志查询、观测日志导出。
该功能主要为区域台网值班人员、预报中心人员提供服务。区域台网值班人员可每天利用此功能批量查阅台站的工作日志,及时发现台站人员填写时是否有迟报、漏报、错报现象;预报中心人员可利用此功能迅速查阅台站人员的预处理日志,比通过前兆数据处理软件查阅更方便、快捷。
2.3 基础信息查询
基础信息查询分为两部分:台网分布和台站详细信息查询。该查询功能中包含的信息量较大,从台网分布可看到全省台站地理位置分布情况(图 3),点击相应的台站后可查看该台站详细信息(图 4)。
台站详细信息又包括台站基础信息、场地、井泉、断层信息等在内的各种基础观测背景信息,通过台站详细信息查询功能可方便地查看每个台站的观测环境、场地条件等,为相关研究中查询基础资料提供快速便捷的服务。
2.4 自动化值班与自动统计
自动化值班部分由自动绘图与报警信息两部分组成。
自动绘图用于查看各学科的数据曲线,每天早晨定时更新,以便用户快速浏览前一天的数据(图 5)。除地磁数据外,所绘制的数据曲线中最后一天数据为原始数据,之前的数据为预处理数据。这样的绘制方式可将最新的原始数据与之前的预处理数据进行对比,从而使区域前兆中心的值班人员能够更加清晰准确地观察到最新一天数据是否出现问题。地磁则根据学科特点将各个台站前一天的分钟值原始数据绘制于一张同时间轴的曲线图上,不同台站用不同颜色进行区分,进而容易判断出当天是否有台站的同步性发生突变。
报警信息会显示各台站各仪器某个测项分量前一天数据中存在的异常情况(图 6)。异常信息按照学科规定的标准和指标、对比前一天和此前九天的数据进行计算,每天早上更新前一天数据的异常信息,方便用户获得初步的异常判断情况,并对数据及时进行预处理。
自动统计模块主要用于每阶段的运行统计(图 7)。该模块分为观测数据目录、数据质量统计、仪器分类统计、仪器数量统计4部分。每个月区域前兆台网中心所关注的仪器运行率、数据连续完整率等都可以通过此模块的部分功能来计算,方便各学科及时关注仪器的运行情况,从而节省每月人工计算的时间,提高工作效率。通过仪器统计列表也能快速查阅是否有仪器存在资料漏填、错填现象,方便检查数据库里仪器信息的完善程度。
2.5 其他
平台首页将区域地震前兆台网的运行月报、跟踪分析年报、国家台网中心每月的评比结果等集中在一起,可以方便区域前兆台网中心的工作人员查看,关注前期工作中出现的问题,并及时解决。
对不同的使用者提供不同的权限,例如,预报中心人员将不能使用自动化值班功能模块,台站人员不具备系统设置的权限等。
3. 解决的主要问题
3.1 图形绘制与异常信息报警
每天定时绘制前十天的预处理数据和前一天的原始数据曲线图,并根据各学科的特点按不同的要求绘图,该部分的设计需考虑各学科的特点。例如地磁学科,不同台站的数据具有很好的一致性,通过同轴对比可以很明显地看出哪一个台站的数据变化不一致,其他学科则不具备这种特点。因此仅将地磁数据绘制成多台同轴对比图。
各学科异常数据指标是异常测项报警的难点,经过咨询各学科专家和查找有关学科观测技术的参考资料,编制出自动绘图模块与异常数据报警的技术要点和技术指标,并取得了学科技术管理组专家的认可。
较现有的各项前兆数据处理、查询软件,该平台首次研制了异常报警功能,能为区域前兆台网人员在日常值班中快速判断出异常信息,提高值班效率。
3.2 文件输出
对于不同查询内容的导出,采用不同的格式进行输出,对于统计数字以EXCEL表输出。例如,在“自动统计”部分,可以导出仪器运行率、连续率、完整率表格;测项查询、日志查询和基础信息查询的结果以表格形式展示,以EXCEL格式导出。
在“自动下载”部分,提供给使用者包括跟踪分析软件、预处理软件等前兆工作常用软件下载功能,也可下载及查阅最新通知、区域台网每月所产出的跟踪分析月报和运行月报等,以便使用者及时关注区域前兆台网最新工作。
3.3 定制检出数据
自动统计部分涉及多个统计表,每个统计表都需要从区域前兆数据库中不同的数据库表中读取需要的数据,整合至一张表格之中,在此过程中需保证产出的数据无遗漏无重复,准确输出所需要的数据。
4. 结语
自2015年9月以来,该平台已在江苏省地震监测中心、预报研究中心、各省属地震台和市县地震部门广泛使用,用于日常资料质量统计、日志查询、基础信息查询等。2015年12月在北京市地震局和山东省前兆台网中心部署试运行。
从初步的反馈结果表明,服务平台界面友好,各项信息查询方便快捷,各种统计报表齐全,可明显提高区域前兆台网的工作效率和预报中心查找数据库信息的效率,且有助于台站人员对观测资料进行质量监控。
目前,国家前兆台网中心大力开展数据跟踪分析工作,该项工作已经成为区域前兆台网中心一项重要且耗时的日常工作。在该平台后续的维护及升级中,还需考虑纳入跟踪分析信息查询,以便前兆工作人员随时查看跟踪分析的审核结果、分析完整率等,在该平台内逐步整合各项前兆工作。
另外,由于各地区所受主要干扰差异较大,故异常数据判别指标差异也较大。在用于不同地区时要根据当地情况多做实验,根据实验结果设置参数指标。因此,为了更好地实现该项功能,需对各区域台网的数据背景进行更加深入的了解。
致谢: 感谢审稿人提出的宝贵意见和建议。 -
表 1 微博数据获取方法
Table 1. Data acquisition methods of Weibo
方法名称 原理与功能 优点 缺点 备注 微博开放平台API 作为1组预先定义的函数,微博运营商将开放的微博产品服务封装为一系列计算机易识别的数据接口,供第三方开发者使用。第三方向固定的网络地址提交参数后,返回数据供使用(杨飞等,2016) 调用简单,无须访问源码及了解内部工作机制等细节,相比网络爬虫等方式,使用更简洁高效 抓取次数有限制,抓取数据不全面,数据获取有一定的成本与难度。运营商对API的权限设置及访问次数进行限制,大部分接口需付费使用(廉捷等,2011) 返回数据格式通常情况下为JSON 和 XML 网络爬虫 作为1段计算机程序, 按照一定的逻辑和算法从互联网上抓取和下载网页,得到网页上的数据。具体操作流程为:设定爬行策略,从预定的1个或多个节点开始爬取网页,获取网页数据及其URL链接,再通过URL链接爬取网络中的其他节点,满足爬行条件后终止爬虫程序,并以文本形式保存(袁浩,2009;廉捷等,2011;游翔等,2014) 数据格式可定制,微博数据的获取一般均适用,且不受微博运营商权限开放范围的限制 稳定性差,时间、人力成本高。微博运营商会不定期调整HTTP请求参数及返回HTML页面格式,导致无法获取和解析微博数据,需定期监测爬虫运行情况(刘晓娟等,2013) 数据源镜像 微博运营商为所需数据的用户提供数据服务(游翔等,2014) 数据质量高 一般不向大众开放,只在政府机关传召时提供 开放数据平台 机构或个人将自己获取的数据集、语料库等以开放平台的形式公开(刘晓娟等,2013) 数据已完成预处理,可直接使用,提高研究效率 常规数据获取类型与范围受限;定制化数据获取收费较高 国内外较著名的数据开放平台有Data mo、Get The Data、SNAP、中国爬萌和数据堂等(刘晓娟等,2013) 表 2 新浪微博地震舆情数据库字段属性
Table 2. Field attribute table of Weibo earthquake public opinion database
序号 字段名称 中文含义 数据类型 备注 1 eqid 地震唯一标识码 字符串 — 2 longitude 微博发布位置经度 数值型 — 3 latitude 微博发布位置纬度 数值型 — 4 mid 微博唯一标识 字符串 — 5 Pub time 微博发布时间 字符串 YYYY:MM:DD HH:mm:ss 6 content 微博内容 字符串 — 7 city 微博用户所在城市 字符串 — 8 uid 微博用户ID 字符串 — 9 nick_name 微博用户昵称 字符串 — 10 user_createtime 微博创建时间 字符串 YYYY:MM:DD HH:mm:ss 11 heading 评论人头像 字符串 — 12 belong_to_mid 评论属于的微博 数值型 — 13 pics 发布的图片 字符串 — 14 belong_to_orzid 评论ID 数值型 — 表 3 部分地震舆情数据(2021年1月1日至2022年3月31日)
Table 3. List of earthquake public opinion data catalogue (From January 1, 2021 to March 31, 2022)
序号 发震时间 纬度/(°) 经度/(°) 深度/km 震级MS 发震地点 数据量/条 1 2021-01-01 6:07:08 26.24 101.27 16 3.0 云南楚雄州大姚县 75 2 2021-01-02 4:24:34 36.86 94.62 9 3.5 青海海西州格尔木市 37 3 2021-01-03 2:40:25 25.63 99.92 11 3.2 云南大理州漾濞县 436 4 2021-01-03 8:34:37 24.69 117.70 28 3.0 福建漳州市长泰县 2 115 5 2021-01-03 16:16:30 43.86 91.48 10 3.6 新疆昌吉州木垒县 18 6 2021-01-04 0:34:11 29.43 104.52 10 3.2 四川自贡市荣县 422 7 2021-01-04 10:58:29 29.41 104.02 13 4.2 四川乐山市犍为县 1 788 8 2021-01-04 21:49:35 31.08 119.51 6 3.3 安徽宣城市广德县 960 9 2021-01-05 8:45:31 35.78 82.49 10 3.1 新疆和田地区于田县 19 10 2021-01-05 11:49:26 42.31 81.13 10 3.1 新疆伊犁州昭苏县 25 …… …… …… …… …… …… …… …… 437 2022-03-25 15:09:42 36.09 77.89 9 3.1 新疆和田地区皮山县 3 621 438 2022-03-26 0:21:02 38.5 97.33 10 6.0 青海海西州德令哈市 3 591 439 2022-03-28 6:21:47 42.88 87.68 14 3.0 新疆吐鲁番市托克逊县 1 071 440 2022-03-28 22:10:00 40.44 83.49 10 3.2 新疆阿克苏地区沙雅县 1 805 441 2022-03-29 5:25:09 30.03 103.41 10 4.3 四川眉山市丹棱县 1 662 442 2022-03-29 9:44:15 42.18 83.51 10 3.2 新疆阿克苏地区库车市 1 175 443 2022-03-29 9:59:33 36.12 77.95 10 3.7 新疆和田地区皮山县 1 141 444 2022-03-30 11:52:28 27.00 103.26 10 3.7 云南昭通市巧家县 1 064 445 2022-03-31 5:59:09 28.35 104.87 10 3.0 四川宜宾市长宁县 1 657 446 2022-03-31 18:05:22 33.77 91.67 9 3.4 青海海西州唐古拉地区 1 922 447 2022-03-31 18:16:02 29.29 105.49 10 3.2 重庆荣昌区 1 892 -
薄涛, 2018. 基于社交媒体的地震灾情数据挖掘与烈度快速评估应用. 哈尔滨: 中国地震局工程力学研究所.Bo T. , 2018. Earthquake disadter data mining and application of rapid intensity assessment based on social media. Harbin: Institute of Engineering Mechanics, China Earthquake Administration. (in Chinese) 薄涛, 李小军, 陈苏等, 2018. 基于社交媒体数据的地震烈度快速评估方法. 地震工程与工程振动, 38(5): 206—215Bo T. , Li X. J. , Chen S. , et al. , 2018. Research of seismic intensity rapid assessment based on social media data. Earthquake Engineering and Engineering Dynamics, 38(5): 206—215. (in Chinese) 曹彦波, 吴艳梅, 许瑞杰等, 2017 a. 基于微博舆情数据的震后有感范围提取研究. 地震研究, 40(2): 303—310Cao Y. B. , Wu Y. M. , Xu R. J. , et al. , 2017 a. Research about the perceptible area extracted after the earthquake based on the microblog public opinion. Journal of Seismological Research, 40(2): 303—310. (in Chinese) 曹彦波, 毛振江, 2017 b. 基于微博数据挖掘的九寨沟7.0级地震灾情时空特征分析. 中国地震, 33(4): 613—625Cao Y. B. , Mao Z. J. , 2017 b. Analysis of the spatial and temporal characteristics of disaster-information about the Jiuzhaigou, Sichuan MS7.0 earthquake based on data mining of Sina Weibo. Earthquake Research in China, 33(4): 613—625. (in Chinese) 曹彦波, 2018. 基于新浪微博的2018年云南通海5.0级地震舆情时空特征分析. 地震研究, 41(4): 525—533Cao Y. B. , 2018. Analysis of the spatial and temporal characteristics of public opinion about Yunnan Tonghai MS5.0 Earthquake in 2018 Based on Sina Micro-blog. Journal of Seismological Research, 41(4): 525—533. (in Chinese) 褚俊秀, 徐敬海, 2016. 地震灾情位置微博抓取与展示. 地理空间信息, 14(5): 38—40 doi: 10.3969/j.issn.1672-4623.2016.05.012Chu J. X. , Xu J. H. , 2016. Capture and display of earthquake disaster information based on geotagged microblog. Geospatial Information, 14(5): 38—40. (in Chinese) doi: 10.3969/j.issn.1672-4623.2016.05.012 何晶, 2012. 新媒体时代的应急响应模式变革. 中国行政管理, (4): 20—24He J. , 2012. The reform of emergency response model in the new media age. Chinese Public Administration, (4): 20—24. (in Chinese) 李亚芳, 王新刚, 梁庆云, 2020. 基于新浪微博大数据的新疆伽师6.4级地震舆情分析及可视化研究. 内陆地震, 34(1): 103—110Li Y. F. , Wang X. G. , Liang Q. Y. , 2020. Public opinion analysis and visualization of Xinjiang Jiashi MS6.4 earthquake based on Sina Weibo big data. Inland Earthquake, 34(1): 103—110. (in Chinese) 廉捷, 周欣, 曹伟等, 2011. 新浪微博数据挖掘方案. 清华大学学报(自然科学版), 51(10): 1300—1305Lian J. , Zhou X. , Cao W. , et al. , 2011. SINA microblog data retrieval. Journal of Tsinghua University (Science and Technology), 51(10): 1300—1305. (in Chinese) 刘婉婷, 杨新月, 刘耀辉等, 2021. 基于微博数据的西藏那曲比如县地震舆情分析. 震灾防御技术, 16(4): 771—780Liu W. T. , Yang X. Y. , Liu Y. H. , et al. , 2021. Public opinion analysis of the earthquake in Biru County, Naqu City, Tibet Based on Webo Data. Technology for Earthquake Disaster Prevention, 16(4): 771—780. (in Chinese) 刘晓娟, 尤斌, 张爱芸, 2013. 基于微博数据的应用研究综述. 情报杂志, 32(9): 39—45Liu X. J. , You B. , Zhang A. Y. , 2013. Review on the data used in researches of microblogs. Journal of Intelligence, 32(9): 39—45. (in Chinese) 刘耀辉, 刘婉婷, 张文焯等, 2022. 基于新浪微博数据的云南漾濞6.4级地震舆情时空特征及情感分析. 自然灾害学报, 31(1): 168—178Liu Y. H. , Liu Y. T. , Zhang W. Z. , et al. , 2022. Spatiotemporal characteristics of public opinion and emotion analysis of MS 6.4 Yunnan Yangbi earthquake based on Sina Weibo data. Journal of Natural Disasters, 31(1): 168—178. (in Chinese) 聂高众, 安基文, 邓砚, 2012. 地震应急灾情服务进展. 地震地质, 34(4): 782—791 doi: 10.3969/j.issn.0253-4967.2012.04.020Nie G. Z. , An J. W. , Deng Y. , 2012. Advances in earthquake emergency disaster service. Seismology and Geology, 34(4): 782—791. (in Chinese) doi: 10.3969/j.issn.0253-4967.2012.04.020 闪淳昌, 薛澜, 2012. 应急管理概论: 理论与实践. 北京: 高等教育出版社.Shan C. C., Xue L., 2012. Introduction to emergency management: theory and practice. Beijing: Higher Education Press. (in Chinese) 王艳东, 李昊, 王腾等, 2016. 基于社交媒体的突发事件应急信息挖掘与分析. 武汉大学学报·信息科学版, 41(3): 290—297Wang Y. D. , Li H. , Wang T. , et al. , 2016. The mining and analysis of emergency information in sudden events based on social media. Geomatics and Information Science of Wuhan University, 41(3): 290—297. (in Chinese) 徐敬海, 褚俊秀, 聂高众等, 2015. 基于位置微博的地震灾情提取. 自然灾害学报, 24(5): 12—18Xu J. H. , Chu J. X. , Nie G. Z. , et al. , 2015. Earthquake disaster information extraction based on location microblog. Journal of Natural Disasters, 24(5): 12—18. (in Chinese) 杨飞, 江南, 李响等, 2016. 基于多策略的微博位置数据获取方法研究. 测绘科学技术学报, 33(2): 201—207Yang F. , Jiang N. , Li X. , et al. , 2016. Research on the method of microblog location data acquisition based on multi-strategy. Journal of Geomatics Science and Technology, 33(2): 201—207. (in Chinese) 杨菁, 杨梦婷, 申小蓉, 2014. 突发事件后微博舆情结构及应急反应特征研究——以雅安地震为例. 理论与改革, (3): 114—118. 游翔, 葛卫丽, 2014. 微博数据获取技术及展望. 电子科技, 27(10): 123—126, 132You X. , Ge W. L. , 2014. Techniques and forecasts on information retrieval in microblog. Electronic Science & Technology, 27(10): 123—126, 132. (in Chinese) 郁璟贻, 张海涛, 罗桂纯等, 2018. 地震应急视频会议系统的建设与应用. 中国应急救援, (5): 31—34Yu J. Y. , Zhang H. T. , Luo G. C. , et al. , 2018. Construction and application of earthquake emergency video conference system. China Emergency Rescue, 13(5): 31—34. (in Chinese) 袁浩, 2009. 主题爬虫搜索Web页面策略的研究. 长沙: 中南大学.Yuan H. , 2009. The research of topical crawler search strategy in Web page. Changsha: Central South University. (in Chinese) -