脸书(Facebook) Messenger总语音流量50%来自柬埔寨的原因曝光
脸书(Facebook) Messenger总语音流量50%来自柬埔寨的原因曝光 简单报
2018年,脸书(Facebook)的团队遇到了一个难题。根据举报人FrancesHaugen公布的文件了解到,柬埔寨用户占Messenger语音功能全球总流量的近50%,但这家公司却没有人知道原因。
脸书(Facebook) Messenger总语音流量50%来自柬埔寨的原因曝光
依据Rest of World查询的內部文档,一名职工提议使用一次调研。她们想要知道,这是不是跟文盲率低相关?同一重要文件表明,在2020年,脸书(Facebook)的一项科学研究尝试了解声频需求量大的我国的用户,但必须遇到一个柬埔寨的被访者。这一疑团,好像一直沒有解除。
如今,让人诧异的是,回答跟脸书(Facebook)的没有太大的关系,反而是跟高棉语的多元性及其用户融入一项从没考虑到过的新技术的方法相关。
在柬埔寨,从嘟嘟车驾驶员到总统洪森,每一个人都喜爱推送语音手记而不是信息。脸书(Facebook)的分析表明,不仅是柬埔寨人喜爱语音信息--虽然沒有别的地区比它更受大家喜爱,在此项探究中,包含来源于多米尼加共和国、塞内加尔、贝宁、象牙海岸的30名用户及其这位单一的柬埔寨人,87%的被访者表明,她们应用语音专用工具来推送跟她们运用上放置的语言表达不一样的手记。WhatsApp--调查对象中最受大家喜爱的服务平台--及其Messenger和Telegram上边的状况基本都是这般。
最多见的因素之一是什么呢?--打字真的很难。
在柬埔寨的情形下,从来没有一个简洁的办法来键入高棉语。尽管高棉语Unicode很早已被规范了,但在2006年至2008年间,电脑键盘自身却落伍了。第一个高棉语电脑的键盘的开发人员务必融入该语言表达的74字符,这也是全世界全部文本中较多的。
这显而易见是一项艰巨的任务。Javier Sola是一位出世在意大利、定居在金边的电子计算机生物学家,他是2005年最开始高棉电脑操作系统新项目的精英团队组员。
在职柬埔寨社会组织Open Institue实行负责人Sola告知Rest of World:“高棉语的标记比拉丁文多很多。”在拉丁文键盘上,用户可以一次见到很多的英文字母,这使打字越来越形象化。但在高棉语中,每一个键都是有2个不一样的标识符,这须要在2个电脑键盘层中间不断旋转。值得一提的是,比较有限的字体样式代表着,假如收货人的电脑没有跟发货人同样的字体样式,一些信息就没法发生。但是,用户们或是成功了。
2009年上下,脸书(Facebook)在柬埔寨逐渐时兴,此外,便宜的智能机和网络接入也逐渐发生,这代表着它的需求量可燃性提高。今日,它仍是本国最受大家喜爱的综合服务平台。但在一个小的智能机显示屏上,一样的打字系统软件越来越基本上不太可能。
2016年美国国际开发署的一份报告单表明,智能机用户更喜欢电話和语音信息,由于她们发觉打字很艰难、很耗时间或由于她们对怎么使用机器设备上的高棉文本觉得疑惑。一些被访者乃至沒有意识到她们的机器设备适用这类语言表达。西方国家用户觉得理所应当的别的作用--如精确的拼写检查或电子光学图像识别--在高棉语中仍只提供基础的作用,这让用户对语言应用觉得消沉。
Sola表明:“如今拥有略微优秀的电脑键盘,但他们沒有自带在手机上--跟Google、三星和微软公司的电脑键盘不一样。”很多年来,大家的习惯性早已硬底化为接纳。他称,在柬埔寨,语音信息仅仅大家的挑选。
这不仅在Messenger。在柬埔寨别的时兴的服务平台上,例如Telegram、WhatsApp和LINE,用户也都喜歡用语音。尽管沒有来源于脸书(Facebook)的全新语音总流量数据信息,但在北京首都金边的柬埔寨人告知Rest of World,她们了解的绝大部分人都借助语音专用工具来得到便捷和语言表达能力。用户说,她们并不感觉在功用上遭受蒙骗,反而是更喜欢推送和接受语音信息的愉快觉得。总体来说,她们对在公共场所讲话并不觉得羞涩,在街上视频录制信息也很自得。
艺术创意领域的灵活就业人员Leng Len表示,这难以再回去了。“它可以开展最有机化学的表述,而且比打字更快。”
但对语音专用工具的依靠也形成了它自身的一系列独特难题。会话越来越短暂性了。这种用户还埋怨称,她们没法回退以追忆她们沟通交流的关键点,只有根据记牢她们留有的语音信息的实际方式来播放这种信息--例如一个长的和2个短的。微信聊天记录中的內容不太可能应用检索作用。殊不知,此外,这类不方便好像并沒有超出其缺点。如今的书面形式信息通常以商业服务或英语聊天为主导。
尽管脸书(Facebook)的职工想像这类个人行为跟低文化水平相关,但依据世行的最新数据,柬埔寨的文盲率约为80%。
“很多年青人,假如它们想打字,便会用拉丁文写下高棉语英语单词,”金边的前端工程师兼POSCAR数据企业CEO Sok Pongsametrey强调。POSCAR是一家为文化教育创建数据平台的企业。别的情况下,假如一个英文字母很难拼读,她们也许会选用更易于得到的标识符来不正确地拼读这个词或用句号来简称一个词--由于她们了解阅读者会认识这一暗含的词。
这有链式反应。Sok称,这种种类的变通方法使从业深度学习的技术工程师最难用这类语气来练习人工智能技术。此外他还担忧,这种近道将代表着年青人将丧失对高棉文本的了解。
“在我用高棉语创作时,我十分当心,由于这也是一门造型艺术,可是年青人,她们觉得(应用拉丁文本)很容易,”Sok讲到。
语音信息在柬埔寨的流行化引起了有关內容操纵和不正确信息散播的难题。声频是众所周知的无法扫描仪、欠缺前后文案件线索,且跟视頻对比,难以辨别它是不是被伪造过。
声频信息直接证据已在一些引人注意的案例中发生,比如逃出柬埔寨的佛家实践家Luon Sovath,他称柬埔寨政府编造了死罪的太阳龙宝宝音频。
当被问到在柬埔寨开展这类调整的資源时,脸书(Facebook)(如今称之为Meta)的一位意味着只提及了一般的对策。“用户可以汇报Messenger上的一切內容,包含语音信息,大家以高棉语为汉语的公司将对一切方式大家制度的具体内容开展审核和申请强制执行。”
新闻发言人还提及了检验有危害视觉效果內容的专用工具及其憎恨支持向量机,但沒有实际回应Rest of World有关音频控制的难题。
Javier Sola强调,有一些较新的电脑键盘如微软公司的SwiftKey,让高棉语键入越来越更非常容易一些,但很多柬埔寨人乃至不清楚他们的存有。
柬埔寨仅仅一个销售市场,很多科技有限公司对开发设计更强的商品没什么兴趣。“她们在这儿赚不到钱,因此它们不项目投资,”Sola讲到。
因此,柬埔寨的用户再次融入着这类方式。当被问到她是不是觉得语音信息会被更强的技术性所替代时,Len表示猜疑--“我不会这样觉得。它有利于推动更合理的会话。”