
性别和地理位置如何决定um
和uh
。
根据语言学家分析的14000
个电话交谈及6
亿条微博可以得出,女性说“um
”的频率比男性多,而男性则喜欢说“uh
”。美国中部的人们在发微博时,通常已“uh
”作为开头,而美国其余大部分地区的人则更多使用“um
”。
在大数据时代,语言研究者可以立刻得出这样的结论。十年前,当我在写一本关于uh
、um
以及其它搪塞语的文化意义及语言意义的书时,我已经很激动有这样的统计资料供我使用。
心理学家和语言学家对口头的uh
和um
一直很感兴趣,因为人们常常不经思考就说出它们。西格蒙德·弗洛伊德(Sigmund Freud
)首先提出通过检查言语失误洞悉一个人无意识的自我。耶鲁大学的精神病学家乔治·马尔(George Mahl
)在20
世纪50
年代继续这一研究,他将患者的情绪状态同他们所使用的uh
、um
及其它所谓的言语停顿结合起来。之后,在20
世纪80
年代,语言心理学家开始使用言语停顿研究大脑是如何产生语言的。
最新数据显示,uh
和um
的使用似乎被烙上社会秩序的印记。八月份的时候,宾夕法尼亚大学(University of Pennsylvania
)语言学家马克·利伯曼(Mark Liberman
)的报告显示,据其对转录的电话交谈的分析,女性说“um
”的频率较男性多出22%
,而男性说“uh
”的频率是女性的两倍多。各种网站上都出现这种新闻,有一条头版是这么写的,“男人说‘Uh
’;女人说‘Um
’”。几天后,英国阿斯顿大学(Aston University
)的方言学家杰克·格里夫(Jack Grieve
)制造了更多的头条新闻。通过对6
亿条微博的统计,他发现喜欢用um
作为句子开头的地区包括东南部、新英格兰和中西部;在一个西至亚利桑那州(Arizona
)、北至爱荷华州(Lowa
)、东到俄亥俄州(Ohio
)的地区,uh
则是那里的人最常使用的句子开头。
当然,微博与说话不同,因此格里夫的结论与口头的uh
和um
没有任何联系。当写出uh
和um
时,它们是经过深思熟虑的。格里夫还说道:“它们有各种各样的其它功能,例如发出困惑、吃惊、挖苦或可爱的信号。”他推测um
比uh
更有礼貌。如果是这样,那么美国东北部偏好的um
可能只是一种地区形式的表达。格里夫在另一研究中称,他发现东北部是美国在语言上最正式的地区,例如东北部的人们使用缩约词的频率比美国其它地区的人少。格里夫注意到其它喜欢使用um
的地区也“往往更正式一点”,例如旧金山湾区(Bay Area
)和东南部。但他承认这是一种直觉。
斯坦福大学(Stanford University
)认知心理学家赫布·克拉克(Herb Clark
)正在研究uh
、um
及其它被他成为“偏离理想”的现象,他注意到大数据表明语言具有临时性。数据可以告诉我们人们说了什么,写了什么,而且不用花多少时间(使用一个已经准备好的数据,格里夫在约一分钟内绘制出了他的uh/um
图表),但它无法帮我们分析出其中的原因。随着数据增加和计算的速度变得越来越快,我们可以期待越来越小的词汇单位组成越来越多的标题。但只有可控的实验可以解释我们所听到的(及看到的),并防止大数据最终成为大噪音。