文档价格: | 100 金币 立即充值 | 文章语言: | 英语-中文 | 原文出处: | 请在文档内查看 | |||||
译文字数: | 10271 字 (节选翻译) | 译文格式: | Doc.docx (Word) | 更新时间: | 2018-04-09 |
在微博媒体上基于事件的用户分类,工业工程外文翻译,分类算法,半监督学习,数据预处理
译文(字数:10271):
摘要: 微博媒体以实时微型博客服务广为人知,受到了社会的广泛关注和用户的大力支持。微博平台为人们提供了一个访问信息的机会,显著改变了人们获取和传播信息方式。同时,它让人们以更方便的方式参与到社会事件的讨论中来。很多在微博媒体上的信息与一些事件有关。用户发布不同的内容,表现出的不同的行为或态度可能对特定事件有不同的影响。因此,对微博上大量未分类的社交圈依据事件进行自动化分类已经成为一个前景广阔的任务。在这种情况下,为了有效地组织和管理大量用户,从而进一步地管理他们发布的消息,在本文中我们以更细粒度的基于事件的方法来处理用户分类的任务。通过分析从新浪微博收集的真实数据,我们研究了微博的属性并利用内容信息和社交网络信息将众多用户分为四个主要团体:名人,组织/媒体账户,草根明星和普通用户。实验结果表明我们的方法能够准确地识别用户类别。
1.绪论
实时微型博客服务[1](在中国称为“微博”媒体),近年来近年来人气飙升。作为一个信息发布和分享平台,微博媒体允许人们获取,发布和传播信息,同时享受分享和社交的乐趣。新浪微博由新浪公司于2009年建立,是最受欢迎的中国微博服务。它表现出一些不同于Twitter的特色功能。例如,新浪微博支持多线程评论功能,分组,音频,消息,直接视频上传和共享等等。它更像是Twitter和Facebook的结合体,完美地融合了信息共享和社交互动。利用新浪微博平台,越来越多的人聚在一起自发地参与社会事件的某些讨论。随着这些讨论,大量的用户内容已经产生和传播,也形成了不断增长的社会圈子。在这种情况下,一个令人很感兴趣的问题是对这些凌乱的社交圈进行分类,并在新浪微博产生的不断增长和不断发展的非结构化数据集中管理庞大的信息。
原文(未统计字数):