对谈计算传播学:来源、理论、办法、与研讨问
  • 作者:秩名
  • 发表时间:2018-04-15 22:07
对谈计算传播学:来源、理论、办法、与研讨问题
 

赢咖平台「计算传播学的呈现是历史的必然,动因大致包括三方面:一是现象、二是数据、三是办法。详细来说:互联网的兴起催生了很多史无前例的传播行为。互联网降生后,人们的线下(offline)生活和网上(online)生活是此消彼长的;往常,网上生活曾经超越了线下生活。这种现象带来了新的研讨数据。网上行为留下了数码踪迹(digital trace),海量数据变得唾手可得。由于有了这些海量数据,传统的数据搜集和剖析办法(比方调查、实验和内容剖析)效率不高、精度不够,所以需求引入新的研讨办法。因而,一批学者开端从事计算办法的开发和推行。计算办法的提高,使得研讨网上行为如虎添翼。总之,『现象、数据、办法』,三方面的条件在最近十几年内相继逐渐成熟,最终招致计算传播学的兴起。」

祝建华教授简介

香港城市大学计算社会科学讲座教授。他先后取得中国复旦大学学士、硕士和美国印第安纳大学博士。曾任美国康乃狄克大学副教授和中国人民大学长江学者讲座教授。现为香港城市大学媒体与传播系讲座教授、传播研讨中心主任,以及互联网发掘实验室兴办人。近年来的研讨兴味包括互联网、社交网、挪动网的运用及效果等。他目前兼任Journal of Computer-Mediated Communication编委、中国计算机学会大数据专家委员会委员等职,并在传播学、计算机、物理、医疗信息等学科刊物上发表其有关网络抽样、网络可控性、互联网信息扩散等研讨结果。他是国际传播协会(ICA)计算办法小组(Computational Methods)的首倡发起人,他最近指导实验室学生团队在中国计算机学会2017年大数据和计算智能大赛中取得三项大奖。

 

JZ:祝建华

HY:黄煜

XZ:张昕之

 

HY:请您谈一谈计算传播学的来源、主要研讨对象和办法的特性。

JZ:计算传播学(computational communication research)不是一门新的学科或新的理论,而是一种新的研讨取向(research approach)或一套新的研讨办法,能够大致定义为:经过搜集和剖析网上行为数据(online behavioral data),描绘、解释和预测人类传播行为及其背后驱动机制的一系列计算办法(computational methods)。其主要数据来源不再是传统的内容剖析、问卷调查和控制实验,而是来自于效劳器日志数据发掘(server log analytics)、网页数据抓取(web scraping)、在线档案数据(online archiving/indexing data)、大范围在线实验(massonline experiment)等;其数据剖析办法除了经典的统计剖析之外,还包括社会网络剖析(social network analysis)、文本发掘(text mining)、空间剖析(spatial analysis)、时间剖析(temporal analysis)等。为了协助了解,我经常用以下这个表来界定计算传播学的边境:

 

表一中的第1和第4格十分分明,不需多说。第2格(如社会化媒体研讨中常见的经过问卷调查研讨大学生运用Facebook)为什么不是计算传播学研讨?由于这类研讨与运用问卷调查研讨读者阅读印刷版《纽约时报》的行为在实质上没有区别,只是研讨场景不同而已。反之,第3格又为什么算作计算传播学呢?我这里专指采用计算办法来搜集和剖析线下传播行为,但这些行为记载一定要被数码化了,不然无法用上计算办法。如Google nGrams把几百万本书扫描成文本数据,在此根底上的剖析研讨就是计算传播学了(Michel et al., 2011)。当然,这一格内的案例不多,很值得计算传播学者去关注和开掘的。以下的对话中提到的计算传播学,主要是指第4格。

计算传播学的呈现是历史的必然(虽然这过程中也有一些偶尔的要素,后面会提到)。必然的要素有三方面:一是现象、二是数据、三是办法。详细来说:互联网的兴起催生了很多史无前例的传播行为。互联网降生后,人们的线下(offline)生活和网上(online)生活是此消彼长的,今天,网上生活曾经超越了线下生活。同时,这种现象带来了新的研讨数据。网上行为能够留下数码踪迹(digital trace),比方网站登陆、在线消费等,海量数据变得唾手可得。由于有了这些海量数据,传统的数据搜集和剖析办法(比方调查、实验和内容剖析)效率不高、精度不够,所以需求引入新的研讨办法。因而,一批学者开端从事计算办法的开发和推行。计算办法的提高,使得研讨网上行为的学者如虎添翼。总之,「现象、数据、办法」,三方面的条件在最近十几年内相继逐渐成熟,最终招致计算传播学的兴起。

当然,计算传播学开展速度之快,远远超出人们的意料。2012年夏天,我参与了第465次北京香山会议,特地讨论能否需求树立数据科学(当时还不盛行大数据的说法)。香山会议是小范围的闭门「神仙会」,属于非正式会议,但讨论结果对高层决策常常有较大影响。那次会议的一个详细成果就是在中国计算机学会内设立大数据专委会,从此揭开大数据在中国的推行、提高(以至炒作)之浪潮。能够说,我从一开端就身在源头,但想不到浪潮这么快就冲到了传播学。

 

HY:这个「现象-数据-办法」的过程,有先后呈现的特定次第吗?

JZ:这个过程在逻辑上应该是先后发作的,但在事实上是平行呈现的。早期,新的传播现象并没有惹起社会科学研讨主流的足够注重。其实,用计算办法对人类媒体的运用行为停止记载和剖析的工作很早就开端了,只不过当时的研讨者不以「计算社会科学」或「计算传播学」作为称号而已。比方,早在互联网之前的1970年代,就开端了对电视收视的在线行为的研讨,称为电视收视剖析(TV ratings analysis,见Webster & Lichty, 1991),可惜这些办法及其成果并没有得到学术界的足够注重。我早年也研讨过电视收视的个体行为,以后有了第一台互联网效劳器后,就很自然地沿用收视率的概念和办法来剖析用户网上行为,所以比拟理解计算传播学的来龙去脉。

假如一定要从时间上来划分的话,计算传播学的开展大致上有三个阶段。第一阶段,针对用户运用行为的研讨,从电视收视剖析的时分开端就有了。第二阶段,应该是到2005年前后,随着社会化媒体平台的呈现和用户自创内容(user-generated content,简称UGC)的呈现,数据来源从后台(效劳器)变到了前台(网页)。在第一阶段时,很多数据是依赖后台提供的;而到了第二阶段,能够直接从前台抓取,学界和业界对UGC这类研讨开端感兴味。第三阶段大约在2010年前后开端,越来越多的学者开端采用不同于传统研讨办法的一系列计算办法,计算传播学这个研讨取向取得了进一步的开展。这其中,大量可得数据的呈现,是贯串一直的一个驱动要素。

 

HY:「计算传播学」成为一个商定俗成的名词是什么时分开端的?有没有标志性的事情?

JZ:我并不主张把「计算传播学」叫做一个学科或一个独立的研讨范畴,而更倾向将其称为「计算社会科学在新闻传播研讨中的应用」。我和几位学生在2014年发表了一篇文章,就是用这一说法做标题的(祝建华等,2014),文中依照传播学「5 个W」(Who [谁]、says what [说什么]、in what channel [经过何种渠道]、to whom [对谁说]、with what effect [产生何种效果])的次第,逐一引见应用计算办法研讨传播学的经典案例。这篇文章,或许算是中文文献中的开端引见计算传播学的一个标志性事情。而说到「计算传播学」这个称号,应该是我的博士生王成军首先提出的。我个人比拟激进,最初并不主张用这个称号,由于计算传播学研讨的仍然是5W的「老问题」。这里当然还有一个不同言语之间的翻译问题。英文比拟精确,叫computational communication research,但译成中文时加了一个「学」字,似乎就成为一个特地的学科了。如今商定俗成了,大家都用计算传播学这个称号,我也只能从众,但每次都要强调这是一种新的研讨取向或一组新的研讨办法,而不是一门新的学科。或许有些年轻后代对此并不满足,以为新取向、新办法背后有其新理论、并且曾经有了新发现,能够叫新学科了。我当然也希望这个取向有朝一日可以孵化、催生出一门新的学科,但目前才刚刚起步,来日方长。

浅显地说,计算传播学的主要研讨对象是「社会化媒体」(social media)。目前很多研讨学者并不是传播学出身,而是来自物理、计算机、工程等学科的学者。这些人不断在运用计算办法。从最早的数据发掘(data mining),到机器学习(machine learning),到如今的深度学习(deep learning),计算办法至少有这么三个开展阶段,(与上面讲的计算传播学开展三阶段并不逐个对应)。而这三个阶段的发作和演化,有必然、也有偶尔的要素,如深度学习的兴起、成为计算办法的最新阶段,就是偶尔的。这是题外话,以后有时机能够特地讲讲这个过程对社会科学根本理念的深入启示。总之,任何技术的兴起,都和满足某种社会需求有关。

在国际传播学术圈内,一个标志性的事情则应该是2014、2015年之间,我和彭泰权、梁海等人在国际传播学会(International Communication Association,ICA)内建议树立一个计算办法(Computational Methods)的兴味小组。作为首倡者和发起人,我草拟了小组的申请报告、对计算传播学做了前面提到的定义和阐明。我们征集了欧美亚太等地50多ICA会员作为发起人,两年多来曾经增加到200多位成员了。首届小组主席由彭泰权担任。这段历史也阐明,中文语境下的计算传播学与国际范围的计算传播学之间的开展是同步挂钩、相互推进的,这种情形在传播学其它各分支中还是稀有的。

我们起初想把这个小组命名为「computational communication research」(简称CCR),但是鉴于ICA曾经有若干预及计算研讨的分会或兴味小组,比方传播与技术(Communication and Technology,CAT)分会和挪动传播(Mobile Communication)兴味小组。为了防止称号上的重合,我提出两个计划,一个叫social media analytics,另一个就是computational methods。最后经过投票,大家在这两个名字当选取了后者,由于前者显得太应用,然后者愈加学术。所以说,我们一开端就把计算传播学定位为研讨办法,希望经过在ICA中树立一个特地小组来为传播学研讨办法的创新作出奉献。假如说任何一个研讨都触及what(做什么)和how(怎样做)这两局部的话,我们更希望为「how」这个问题提供一个讨论的场所。推行开去,任何一个成熟的学科都有一个特地讨论办法论的刊物。最近听说德国的一些学者在推进ICA成立一个传播研讨办法小组,专注经典办法的讨论。从时间上看,ICA先有新的计算办法小组、再有经典办法小组,则是一件与众不同、值得回味的趣事。赢咖平台