第一句子大全,网罗天下好句子,好文章尽在本站!

19万文本数据解读“老司机”的语义演化 | 网络热词观察系列

时间:2008-09-01

不同于一般的网络热词,老司机有一些独特之处,它的流行和发展经历了一个去低俗化和日常化的过程,它的词义也在使用过程中不断扩大化和丰富化,而且在不

友情提示:本文共有 5473 个字,阅读大概需要 11 分钟。

网络热词观察·第三期

“老司机”是2016年十大网络流行语之一,从2015年底开始流行至今,仍然保持着较为旺盛的生命力(如图1)。不同于一般的网络热词,“老司机”有一些独特之处,它的流行和发展经历了一个去低俗化和日常化的过程,它的词义也在使用过程中不断扩大化和丰富化,而且在不同的平台上词义也有所不同。

图1:“老司机”搜索热度趋势图

(来源:百度指数)

因此,我们通过数据分析和文本分析的方法,搜集了百度、360、谷歌三大搜索引擎的“老司机”搜索数据,通过爬虫软件抓取了微博、百度贴吧、哔哩哔哩动画、知乎、天涯社区五大平台涉及到“老司机”的相关文本总计19万余字,包括851条微博,225条百度贴吧主题帖,1000条哔哩哔哩视频,198条知乎提问,750篇天涯帖子,希望能够回答以下几个问题:

■ “老司机”是什么?

■ “老司机”经历了哪些变化?

■ 谁在关注和使用“老司机”?

■ “老司机”的使用在不同平台有什么区别?

■ “老司机”为何能够持续走红?

■ 如何成为一个“老司机”?

“老司机”进化史

众所周知,“老司机”的本义是指驾驶经验丰富、驾龄长的司机。从2015年成为网络用语开始,“老司机”的词义开始变化发展,如今泛指在某领域内经验丰富的人。

“老司机”的说法在网络上很早就因为各种特指含义而慢慢传播着,从2015年逐渐开始广为人知。在A站、B站、贴吧、论坛等各种网络社区中运用较多,意指那些手头保有的资源丰富的人。因此“老司机”经常特指在网上分享资源,或者显摆自己资源的人,并常伴随着“老司机快发车”、“老司机带带我”、“老司机又发车啦”这样的语句使用。这种“老司机”通常可能具有的特点:资源的绝对存量较大,乐于同大家分享自己的资源,阅览过的资源较多,能够一眼认出许多资源出处,或者收藏资源的类别特殊,或者口味较重。

2016年,“老司机”的热度和“老司机带带我”的热度同时达到峰值(如图2)。这种现象源于一首云南山歌《老司机带带我》的突然走红,歌词非常低俗,“老司机”由此广为人知,但是含义也发生了变化,那些在某些“低俗”甚至“两性关系”方面经验丰富的人开始被称为“老司机”,含义越来越“污”。

图2:“老司机”和“老司机带带我”的搜索热度趋势图

(来源:百度指数)

随着“老司机”在网络上甚至现实生活中越来越多地被使用,它的引申意义也越来越多,在近两年的广泛流传中,“老司机”的含义经历了一个去低俗化的过程。现在绝大部分被用于表示那些长时间混迹于某一领域,在某一领域资历和技术经验成熟,或者手中具备丰富的资源并且乐于和大家分享资源的人。虽然“污”的含义仍在,但整体上“老司机”开始被赋予中性偏褒义的色彩。

图3:“老司机”词义扩大过程示意图

在其中,最能体现“老司机”一词的去低俗化当属媒体报道的中的运用,“老司机”一词从一个带有一点“污”色彩的网络用语,到可以因其丰富的词义被运用在媒体报道中的过程,其实就是一个去低俗化的过程。

我们统计并分析了人民网和新华社数据库中所有提及“老司机”的新闻,结果如下:

人民网中“老司机”相关新闻共5184条,2016年之前使用的全部都是“老司机”原义,2016年3月11日第一次出现新用法:“《我是歌手4》上演终极踢馆赛,金志文改编震撼全场,乐坛老司机不怯场,即兴创作‘挑衅’在线歌手。”筛选掉2016年之前的新闻后,2016年之后“老司机”相关新闻共1716条,其中使用“老司机”原义的占比38.9%,表示“有经验”的含义的占比51.9%,表示“污”的含义的占比约9.2%。(如图4所示)

在新华社的报道中,第一次使用“老司机”新用法是在2016年6月:《新华朋友圈:老司机也不能如此任性》、《别以为90后当不了“老司机”他们采访、剪片样样玩得转》。此后“老司机”相关新闻共316条,没有涉及到“污”含义,使用“老司机”原义约占62.3%,表示“有经验”的含义的约占37.7%。(如图4所示)

图4:人民网、新华社使用“老司机”各含义占比图

(数据来源:人民网数据库、新华社数据库)

谁在关注和使用“老司机”?

从地域分布来看,在热议程度上,实时热议最活跃的平台新浪微博的数据显示,“老司机”热议度最高的地区是广东,其次是北京;在搜索指数上,国内最大的搜索平台百度的数据显示,搜索“老司机”的网友仍然是广东最多。(如图5)

图5:微博热议和百度搜索分布图

(来源:微指数、百度指数)

因此我们推测,在经济越发达的地区,人们越容易接触网络,进而对新兴的网络用语更容易接受和使用。但是也不排除这些地区人口基数大、网民比较多对数据所造成的影响。

从性别分布来看,在百度和360平台上搜索“老司机”的人中男性的比例远远大于女性,而在微博上使用“老司机”这个词的男女比例却基本上不相上下。(如图6)

图6:性别比例分布图

(数据来源:微指数、百度指数、360指数)

从中我们可以看出,男性比女性更频繁地使用搜索引擎来搜索“老司机”的相关内容,男性可能比女性更想得到跟“老司机”相关的一些资料或者资源(具体想要得到什么,我们会在下文继续讨论)。

而在日常发微博的过程中,女性和男性使用“老司机”这个词来发微博的频率不相上下,所以在这个词的日常讨论和使用上,男女之间并没有很大的区别。

从年龄分布来看,各个平台搜索和使用“老司机”的年龄分布没有呈现出很大的差异,使用该词最多的网民主要集中在20-35岁。(如图7)

图7:年龄分布图

(数据来源:百度指数、微指数)

但是我们有一个有趣的发现:在微博这种社交平台上,19-34岁的人是“老司机”的使用主力,但是在百度这种搜索平台上,30-49岁这个群体却占了很大的比重。这可能是因为,年轻人更倾向于在社交平台上使用这种网络流行词,而较为年长的人可能因为不理解新兴网络用语的含义而更倾向于去搜索平台上寻求答案。另外一种可能是年轻人使用社交平台较多,而年长的人仍然集中在百度等比较传统的平台上。

除了地域、性别、年龄,我们还有一个有趣的发现。根据新浪微指数公布的用户数据显示,在新浪微博上,使用“老司机”这个词的星座分布如图8所示:

图8:新浪微博老司机使用情况星座分布图

(数据来源:微指数)

为什么摩羯座和天蝎座比其他星座更喜欢使用“老司机”呢?是比较污吗?

当人们搜索“老司机”时在搜些什么?

我们分析了百度、360和谷歌三大搜索引擎人们在搜索“老司机”时的相关词、来源词和去向词,从中可以看出人们在各个平台上搜索“老司机”时想要得到的是什么。(如图9)

图9:老司机相关搜索词分布

(数据来源:百度指数、360指数、谷歌指数)

可以看出,人们在搜索平台搜索“老司机”时,主要是在寻找相关视频、在线网站、资源、成人视频等资源,或者是询问“什么意思”。

结合我们上面对搜索平台上性别的分析,是不是说明男性对这方面视频的需求比较多呢?当然啦,这只是一个猜测,真实情况我们就不得而知了~

当人们谈论“老司机”时在谈些什么?

正如我们在开头提到的,“老司机”在发展过程中经历了一个词义扩大化的过程,现在的“老司机”有资源丰富、经验丰富、两性知识丰富等不同的含义,在不同的平台上,人们使用“老司机”这个词时想要表达的含义也是不同的。

对此,我们抓取了新浪微博、百度贴吧、哔哩哔哩动画、知乎、天涯社区五大平台总计19万余字的文本,进行分词和词频统计,筛选掉一些“我们”“它们”“因为”“所以”等无意义的词语之后,做出了各个平台的关键词词云。

同样的词在不同的平台有不同的用法,体现了不同平台惯常讨论语境的不同。

在百度贴吧,“老司机”的相关词真的很污很黄暴,远远超出了我们的预想。(如图10)

图10:贴吧关键词词云

在新浪微博,相关词非常混乱,“搞笑”、“视频”、“地址”几个词出现最为频繁,可能是因为在微博上讨论“老司机”时人们更倾向于分享和转发相关的搞笑视频。除此之外,几乎没有其他特别频繁的关键词出现,因为微博本身就很日常化,人们发布的微博也都是各种内容都有的大杂烩。(如图11)

图11:微博关键词词云

(数据来源:新浪微博)

在哔哩哔哩动画,“老司机”会更多的跟视频、动漫、二次元、日本、妹子等“宅文化”的内容相关,其中“费玉清”也是B站上非常著名的老司机梗了……(如图12)

图12:B站关键词词云

(数据来源:哔哩哔哩动画)

在知乎,从“难题”、“什么”、“干货”、“看法”等等几个关键词可以看出,人们在提到“老司机”时,大多是一种“学术”上的讨论,求助某个领域的“老司机”来解答自己的疑问,或者互相分享一些看法、经验和干货。(如图13)

图13:知乎关键词词云

(数据来源:知乎)

在天涯社区,“老司机”的使用和上述几个平台出现了明显的不同。根据关键词可以看出,大部分关键词都是跟“老司机”的原义相关,即开车、驾驶。(如图14)

在我们选取的天涯750篇提及“老司机”的贴子中,使用“老司机”原义的有679篇,使用“有经验”的含义的有43篇,使用“污”的含义的仅28篇。所以在天涯论坛上,人们谈及“老司机”时谈论的还是跟真正的驾驶有关的问题,比较倾向于使用“老司机”的原义。

图14:天涯关键词词云

(数据来源:天涯社区)

“老司机”为什么能持续走红?

我们搜集了从2015年到2017年每年度网友总结的十大网络热词,从中筛选出了被百度指数收录的20个网络热词,根据百度指数的搜索热度趋势,统计了每个网络热词所流行的时间长度(以月为单位),以此来对分析这些流行语的生命力(如图15)。

图15:热度持续月份数对比图

(数据来源:百度指数)

通过对比分析可以发现,“老司机”近三年众多网络流行语当中,生命力几乎是最长久的,并且至今仍处于高热度(如文章开头部分的图1所示)。那么为什么“老司机”这个网络热词就能持续走红呢?

我们通过查阅相关文献,总结出以下几点原因:

1、语言系统的内部因素

在全民语言中,“老+中心语”是常用的词语组合或短语组合结构,或表示经验丰富,或表示技术娴熟,或表示年长可敬,或表示亲切称谓等,而且其使用频率很高,如“老炮”“老船长”“老机长”等。从形式上看,“老司机”结构简单,层次分明,读起来朗朗上口,符合人们的认知心理。

2、语言背后的社会背景与社会心理

一方面,资源共享模式的兴起如资源站、知乎知识分享平台等等带来了“老司机”一词最初的词义变化和扩展使用。

另一方面,随着文化的开放,社会心理对于性文化的接受程度越来越高,尤其是年轻人开始渐渐敢于讨论一些比较“污”的事情,让“老司机”一词带上了比较污的意思时能得到进一步扩展使用。

最后,“老司机”本身蕴含的俏皮意味让人们在求助别人的时候更易启口,这也让“老司机带带我”从一句带有污意味的歌词变成了大家日常挂在嘴边求别人帮忙时的用语。

3、“开车”一词与“老司机”的连带兴起以及“老司机”表情包的运用

“开车”作为讲黄段子的含蓄版表述现在在年轻人中同样非常流行,这也带动了“老司机”一词使用的繁荣。除此以外,“老司机”这一次被制作成的各种各样的表情包也这一词语的流行生命力在表情包界被不断延续。

如何成为一个“老司机”?

根据上文对“老司机”的进化史以及多种不同含义和不同使用情景的分析,你知道该如何成为一个老司机了吗?

(这是开玩笑的,科科)

如果你想成为驾驶“老司机”,那你就需要会开车、有驾照、驾龄长……

如果你想成为经验丰富的“老司机”,那你就需要在自己擅长的领域拥有丰富成熟的经验,能够和其他人分享干货,甚至能够carry其他小伙伴……

如果你想成为资源“老司机”,那顾名思义你需要掌握很多资源以及获取资源的独特渠道,当然这些资源可能比较特殊,你懂的……

如果你想成为非常污的“老司机”,那你可能需要学习掌握大量两性关系等方面的知识……

图16:如何成为一个老司机

结语

罗常培先生说:“一个时代的客观社会生活,决定了那时代的语言内容;也可以说,语言的内容足以反映出某一时代社会生活的各方面。社会的现象,由经济生活到全部社会意识,都沉淀在语言里面。”

语言是社会的一面镜子,在对“老司机”的数据和文本分析背后,我们找到了最初研究这一问题的时候的一些答案,如“老司机”是如何进化到拥有如此丰富的词义的、哪些人更喜欢使用“老司机”、“老司机”的用法等。

但我们希望这一次研究不停留于表面,而能挖掘出一些更深层次的东西,那么关于“老司机”在不同平台的用法的差异、“老司机”在搜索和使用平台使用者的差异、不同性别者在不同平台上的不同表现乃至于“老司机”作为一个网络热词走红背后的原因探究对于我们来说,则算是研究的意外之喜了。通过这些发现,结合合理的理论依据,我们可以推断出一些对于现实比较有指导意义的结论,比如怎样捧红一个网络热词、如何成为一个“老司机”等。

最后,祝大家都能成为“老司机”,嘿嘿!

数据来源:

百度搜索、360搜索、谷歌搜索、微指数、新浪微博、百度贴吧、哔哩哔哩动画、知乎、天涯社区、人民网数据库、新华社数据库等。

参考文献:

[1]王立新.试从杰弗里·利奇的意义七分法角度谈网络用语——以“妇女”不愿过节以及“老司机”、“小鲜肉”等为例[J].文教资料,2017(07):23-24.

[2]孔德超.“老司机”添新义[J].语文建设,2017(01):65-66.

研究员:李忻蔚 林诗瑭

指导老师:方洁

您的支持是我们前进的动力

本文来源:人大新闻系

本期编辑:林俊鹏 曹洋红

网络热词观察系列:

你了解“键盘侠”吗?我们分析了十余万文本数据来勾画这个群体|网络热词观察系列

想成为“人生赢家”?你需要了解四大社交平台如何定义成功|网络热词观察系列

本文如果对你有帮助,请点赞收藏《19万文本数据解读“老司机”的语义演化 | 网络热词观察系列》,同时在此感谢原作者。

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。
相关阅读
文本分析/话语分析/内容分析还分不清?建议直接背这篇!

文本分析/话语分析/内容分析还分不清?建议直接背这篇!

...性工作,不仅速度快,而且保证了编码标准的一致性。对数据的统计工作也可以交由相应的统计软件完成,百分比、平均值、相关分析、回归分析等各种统计分析均可实现,而且精度更高。解释与检验。研究人员要对量化数据做...

2023-06-23 #经典句子

把文本变成画作 AI对艺术“下手”了

把文本变成画作 AI对艺术“下手”了

...理的边界已经被打破,多模态AI 系统正在逐步建立。 “数据的来源或者形式是多种多样的,每一种都可以称为一种模态。例如图像、视频、声音、文字、红外、深度等都是不同模态的数据。单模态AI 系统只能处理单个模态的数...

2023-08-05 #经典句子

“千言数据集:文本相似度”权威评测 网易易智荣登榜首

“千言数据集:文本相似度”权威评测 网易易智荣登榜首

...术与服务品牌——网易易智在CCF和百度联合举办的“千言数据集:文本相似度”行业测评中击败多支劲旅,荣登榜首。文本相似度,即识别两段文本在语义上是否相似,在自然语言处理(NLP)领域是一个重要研究方向,目前已大...

2023-07-17 #经典句子

Python的8种文本处理工具合集!Python入门

Python的8种文本处理工具合集!Python入门

...定义词典等。2、NLTK:一个构建Python程序以使用人类语言数据的领先平台,被称为使用Python进行教学和计算机语言学工作的绝佳工具,以及用自然语言进行游戏的神奇读书馆。3、TextBlob:是一个用于处理文本数据的Python库,为潜...

2023-08-16 #经典句子

2021最新文本综述:从浅层到深度学习(附PDF下载)

2021最新文本综述:从浅层到深度学习(附PDF下载)

...十年中该领域的研究激增。已有的文献提出了许多方法,数据集和评估指标,从而需要对这些内容进行全面的总结。本文回顾1961年至2020年的文本分类方法,重点是从浅层学习到深度学习的模型。根据所涉及的文本以及用于特征...

2023-07-31 #经典句子

你最关心的马蜂窝事件舆论全景图在这里 用文本挖掘一挖到底

你最关心的马蜂窝事件舆论全景图在这里 用文本挖掘一挖到底

...最快,但信息也最为混沌的地方,事实与谣言边界模糊。数据来源:全网数据,数据统计时间:2018年10月21日-2018年10月23日这不是一个国产的问题,前不久Facebook也因面临挑战,在软件中推出反辱骂等限制不良评论的功能。早在19...

2017-06-27 #经典句子

文本挖掘实操|用文本挖掘剖析54万首诗歌 我发现了这些

文本挖掘实操|用文本挖掘剖析54万首诗歌 我发现了这些

...结合的。既然诗歌的创作是有规律的,那么,通过一定的数据挖掘手段,我们能够从中发现一些insight。在本文中,笔者循着这个思路,将运用若干文本挖掘方法对手头的诗歌语料库(该诗歌原始语料库地址为https://github.com/Wernero...

2022-12-30 #经典句子

「首席架构师推荐」文本挖掘软件列表

「首席架构师推荐」文本挖掘软件列表

文本挖掘,也称为文本数据挖掘,大致相当于文本分析,是指从文本中获取高质量信息的过程。高质量的信息通常是通过设计模式和趋势通过统计模式学习等手段获得的。文本挖掘计算机程序可从许多商业和开放源码公司和源代...

2010-03-20 #经典句子