随着(zhe)信息技(jì)术迅(xùn)猛发展,新(xīn)型信息分析技术被(bèi)应用到政治学研(yán)究中(zhōng)来。许(xǔ)多政治学研究者采用当前比较成熟的大数据爬取(qǔ)、大数(shù)据文本分析(xī)等技术,获取新的研究素材并(bìng)进行分析整(zhěng)理(lǐ)。同时,以亿(yì)万为量级单位的(de)大(dà)数据本(běn)身(shēn)就具有政治学研究价值。可以说(shuō),大数据为(wéi)政治学带来研究方(fāng)法上的创新(xīn),也进一步拓展了政治学研究领域。
基于大数据对网络民意进(jìn)行研究(jiū)。网络上有许多(duō)现成数据可以用于对网络民意和政府部门(mén)回应进行研究(jiū)。一些政治学研究者(zhě)常(cháng)把两类(lèi)网络大数(shù)据用作(zuò)分析(xī)素材:一(yī)类是政府网络问政(zhèng)平台上(shàng)的(de)群众留言及相关部门回复信息,另一(yī)类是主流(liú)媒体网站以(yǐ)及微(wēi)博、微信等社(shè)交媒体平台上的网民发(fā)帖信息。这些数据都(dōu)可通过数据爬取技术(shù)直(zhí)接获取。第一类数据经过(guò)分析处理后,可以反映(yìng)群众关注的议(yì)题类型分布、政府相关部门回应(yīng)的特(tè)点和问题解(jiě)决(jué)程度。还可(kě)以进一步分析(xī)特定类(lèi)型群体在什么(me)时期(qī)大致(zhì)提出哪些类(lèi)型的诉求。第二类数据主要用于分析网民(mín)对(duì)某一具体事件的(de)看法和态(tài)度(dù)。对微博等社交媒(méi)体(tǐ)的数(shù)据分析,不仅(jǐn)关注具体话题,还将话题和情感、偏好等因素分析相结合,呈现网络民(mín)意对某个具体(tǐ)事件的态度演变过程及影响网络民意变化的(de)具体因素(sù)。可以说,网络大数(shù)据的(de)应用极大(dà)丰(fēng)富了政治学对(duì)网络(luò)民意的研究方(fāng)式。
对文本(běn)转换后的大数据进行分析。在网络大数据(jù)之后,研究者(zhě)尝试挖掘其(qí)他非现成的、更具独特性的大(dà)数(shù)据(jù)信息。这(zhè)类信息(xī)主要有两(liǎng)种(zhǒng),一种是(shì)从公(gōng)开平台获取的大数(shù)据文本。这(zhè)类数据通过数据爬取技术获(huò)得,但发布这(zhè)些数据(jù)的(de)平台(tái)并(bìng)非人人皆知,需要(yào)研究者去搜寻。目前(qián),政治(zhì)学研究(jiū)者较多关注并取得(dé)研究进展的大数据主要(yào)有:从裁判文书(shū)网获取的司法(fǎ)大数据,从(cóng)人大代表的议(yì)案建议库和政协委员的提案库中获得的文本大数据等。随着政府信息公(gōng)开力度加大(dà),这类可供研究的信息资源会越(yuè)来越丰富。另一种数据需要先进行文本转(zhuǎn)换才可使用(yòng),如对历史资料的研究(jiū)。相当数量的历(lì)史资料(liào)是以图片形(xíng)式而非文本形式存在的,这就需要(yào)通(tōng)过识别技(jì)术将(jiāng)图片(piàn)信息(xī)转换为文字(zì)文本,然(rán)后进(jìn)行大数据分析。这类(lèi)数据的获(huò)取(qǔ)难度较高,不过一旦形成数据库(kù),对政治(zhì)学(xué)研究则有较大帮助。
大数据为政治学提(tí)供新的研(yán)究(jiū)素材和分析技术,但并未改变政治(zhì)学(xué)研究的本(běn)质。面对(duì)层出(chū)不(bú)穷的(de)新素材和新工具,政治学研究(jiū)者需要保(bǎo)持清醒头脑(nǎo),不能陷(xiàn)入对数据和方(fāng)法的盲目追(zhuī)求中。同时(shí),应结合政治(zhì)学研究本身的特点,发挥大数据技术优势,推动信息技术(shù)在政治学研究应用(yòng)中取得更多突破。一是开发更多样化的大数据类(lèi)型。目(mù)前,政治(zhì)学研究分析的大多是文本(běn)形式的大数据。文本信息只是浩瀚信息世界(jiè)中的一(yī)种,还有图片、音频、视频等大量信息类型有待(dài)开发利(lì)用。这些(xiē)类型的大数(shù)据有的在(zài)商业领域已有较成熟的应用(yòng),研究者可考虑(lǜ)以合适方式将其应用于政治(zhì)学研究。二是(shì)探索更前沿(yán)的大(dà)数据分析技术。现有(yǒu)的(de)分析技术还(hái)离不开人工标注,需要政治学研(yán)究者从(cóng)大数(shù)据中抽出很小一部(bù)分,对这部分数据进(jìn)行人工阅读和标注(zhù),然(rán)后利用机器学(xué)习的(de)方法,让计(jì)算(suàn)机基于人工标注的数据(jù)去分(fèn)析剩下的大量数据,尝试得出相应结论(lùn)。由于(yú)人工(gōng)标注的数量不(bú)等(děng),分析的效(xiào)果也参(cān)差不齐。在文本挖掘上(shàng),需要进(jìn)一步开发更(gèng)先(xiān)进的(de)技术(shù)。三是实现更(gèng)复(fù)杂的(de)大数(shù)据分析(xī)目标。现(xiàn)有(yǒu)的大数据(jù)分析主要(yào)是对数据(jù)所体现的政治现象(xiàng)进行描述,尚未具备解释政治(zhì)现象、发现(xiàn)运(yùn)行规律以及(jí)进行预测(cè)的功(gōng)能,这(zhè)需要(yào)更进一步的技术支持和研究突(tū)破。从这个角度看(kàn),大数(shù)据的开发(fā)利(lì)用在政治学研究领域还(hái)有更为广阔(kuò)的发展前景(jǐng)。