情绪分析:为什么它从来没有100%的准确性

原标题:情绪分析:为什么它从来没有100%的准确性

如果你曾经使用过社交倾听或社会监控工具来分析情绪,那么你就会熟悉困扰所有这些工具的不准确之处–从不正确的标记到扭曲的情绪百分比。为什么会这样?第一个问题是有些句子不容易分析。事实上,句子一点也不积极或消极。在这个主题中最常见的假设是,主观句子总是表达一些感情,而客观句子却不表达。这通常是这样的–毕竟,一个客观的句子表示事实信息,而一个主观的句子则表达个人的感情、观点或信仰。然而,它并不总是那样工作。

例如,“我想我有最新版本的浏览器”这样的句子有什么感想?当然,这是一个主观的句子,但它没有表达任何感情。然而,“我在更新浏览器之后打开浏览器并使浏览器不断崩溃”这样的客观句子又如何呢?它是客观的,因为它表明了一个事实,但它表达了一个隐含的观点:浏览器的持续崩溃-负面。话虽如此,虽然我们知道最后一句表达的是负面情绪,机器怎么知道不断崩溃的浏览器不是件好事?

今天情绪分析不准确的原因是什么?我学到的一件事是学语言学语言是复杂的。过于简化语言,认为机器或算法总是能准确地检测其潜在的情感,这将是太天真的做法了。目前,有五个主要因素阻止我们盲目依赖情绪分析工具:

  1. 语境一个积极的或消极的情绪词可能有相反的含义,取决于上下文。“我已经说得很清楚了做得很好“可被解释为积极的声明。然而,在“我的互联网提供商”中干得好当涉及到偷我的钱“,做一个伟大的工作不再是一件积极的事情,根据上下文(”从我那里偷钱“)。
  2. 情感歧义::带有肯定或否定词的句子不一定表达任何感情。例如,“您能推荐一个我可以使用的好工具吗?”没有表达任何情感,尽管它使用了积极的情感这个词。“好的“同样,没有感情词的句子也能表达感情。因此,“这个浏览器使用了很多内存”并不包含任何情感词,尽管它清楚地表达了一种负面情绪。
  3. 讽刺如果句子中有讽刺的话,一个积极的或消极的情绪词可以改变情绪。“当然,我是高兴的让我的浏览器在我的课程中崩溃“显然是一种讽刺(和否定)的说法,尽管它有一个积极的词”。高兴的“我们可以主要从句子的开头“确定”和上下文(我们知道浏览器崩溃是负面的)来判断讽刺的意思。
  4. 比较社会倾听工具常常误解比较陈述。例如,“百事可乐比可口可乐好得多”的感觉是什么?如果你是在为百事报道,那么这绝对是一个积极的声明。然而,如果你在可口可乐公司工作,并且你要向公司汇报,那么这个声明将是负面的。大多数社交听力工具没有足够的智能来“挑边”,当他们发现像上面这样的比较陈述时,让他们根据关键词来选择情感。因此,前面的示例将被标记为“正”,因为它包含一个正关键字,“好多了“”,不管你是为谁报道的。
  5. 区域变化一个词可以根据所使用的语言改变情感和意义。这常见于俚语、方言和语言变体。一个例子是“病态”这个词,它可以根据上下文、语调和语言改变意思,尽管目标观众很清楚(“那是一首恶心的歌!”).“我一点也不舒服,我可能病了”)。

影响情绪分析准确度的最大威胁是情绪分析的准确性。人类和谐这是人类(或人与机器)之间的一致程度。大量的研究表明,人类的符合率在70%到80%之间。即使是人类在任何主观问题上都不一致,所以难怪在文本中没有额外的文本线索(视觉、听觉等)来表达情感。对我们人类来说是很棘手的,更不用说机器了。因此,可悲的是,我们离完美的情感分析还差得很远。然而,尽管目前存在缺陷,社会情绪仍有很高的潜力。虽然它很容易被看作是一个“软度量”,但在上下文中使用它是非常有用的-是的,你收到了一个积极的评价,但是它对你的品牌意味着什么?这些具体内容背后的基本观点是什么?在正确的人手中,情感可以成为各种社会分析、预测的关键,并最终对你的社会表现有一个坚实的洞察力。

责任编辑:

Thenews.cc