在当下,技术如何为公益事业的发展平添助力?公益的发展在得到技术的加持后,又会获得怎样的生机与活力?4月18日,北京字节跳动公益基金会副理事长兼秘书长李涛来到在上海举办的火山引擎“2023Force原动力大会”,并以字节跳动公益基金会为例现身说法,和与会者分享了自己的观点。
李涛表示,与火山引擎的合作,让人看到了技术背后的温度。通过发挥技术禀赋,以及与公益事业的结合,让每个人都能享受到数字生活的美好,真正实现了高效、开放、平等的数字公益理念。
以“识典古籍”为例,是抖音公益与北大合作共建的古籍阅读平台,致力于为用户提供免费公开、稳定、快速、方便的检索和阅读古籍的服务,“让阅读更智慧”。
2022年10月,该平台由“北京大学—字节跳动数字人文开放实验室”共同研发上线。目前,平台涵盖了390部经典古籍,主要来自《四部丛刊》,共计3000多万字,并向公众免费开放。李涛表示,“识典古籍”将陆续完成一万种古籍的智能化整理工作,基本覆盖儒家、道家和佛学的核心典籍目录,将全部免费开放。
“识典古籍”使用了包括文字识别、自动标点和命名实体识别,以及DCR、NLP、知识图谱在内的多种核心技术,实现了知识关联、分词检索、字典音义和繁简图文对照等核心能力。
据悉,当前行业内OCR识别准确率平均为93%至94%,而“识典古籍”的准确率则达到了96%至97%。与其他古籍数字化平台相比,“识典古籍”页面简洁,浏览流畅,并提供影印底本作为参照,便于专业研究人员、广大古籍爱好者使用。
李涛在发言中提到了2022年举办的卡塔尔世界杯。中国有2000万听障人士,他们无法像其他观众一样,在看球的同时,感受到足球解说的魅力。而火山引擎在世界杯期间,借助火山同传的技术能力,以及火山语音的语音识别能力,为广大听障人士输出了更加快速精准的同传字幕,为观赛带来优质体验。
具体来说,通过“背景声优化”,无障碍直播间在细节之处降低了错误率,以一套自动化的方式,从足球比赛音频中提取出噪声片段,在模型中显式地建模噪声,将噪声误出字的比例下降了95%,通过数据增强方式提高声学模型在足球场景下的鲁棒性,在有背景音的情况下,也能清晰识别人声,实现更好的流式字幕效果。
对于比赛中出现的大量专业术语以及外籍教练、运动员的人名,火山语音团队率先整理了大量与足球相关以及与世界杯相关的语料,在此基础上训练语言模型,通过语言模型干预的方式,提高了模型在足球领域的适配性。具体根据 RNN-T的建模方式,通过解藕声学模型和语言模型,构建了一套灵活和高效的语言模型干预流程。
无障碍直播间的推出,大大提升了听障人士的观赛体验,很多听障人士表示,这是有史以来看过的最爽的足球赛。通过火山引擎提供的技术,真正实现了“让信息无障碍”。
在会上,李涛还提及了火山引擎技术为公募基金会打造公益电子票据系统等实例。他表示,通过引入火山引擎的各项技术,字节跳动公益基金会得以在更多领域,为更多需要公益服务的人群提供了帮助,技术在这一刻体现了其巨大的社会价值。希望在未来,火山引擎能够凭借更多新技术成果,让更多的人感受到数字时代生活的美好。
责任编辑:kj005
文章投诉热线:156 0057 2229 投诉邮箱:29132 36@qq.com