游戏语音“简史”,迈向极致沉浸式语音体验

游戏语音“简史”,迈向极致沉浸式语音体验

无社交,不游戏,大家都深知社交在游戏体验中的重要性。

一方面,游戏是天然的社交平台,能提供足够的话题和场景维持社交行为,另一方面,社交功能可以满足人的天性,让玩家更好地体验游戏,从而能够显著的提高游戏中用户的留存。

游戏语音作为社交的一个重要手段近年来越来越受到游戏开发商的重视和玩家的欢迎,当前市场上的游戏语音软件和方案颇多,提供的功能也各式各样,本文将从游戏语音发展史的角度,对游戏语音做个简要的介绍。

游戏语音工具的发展实际上也是伴随着互联网的发展,经过20多年的时间,从对单一平台的支持到对多平台互通的支持,从双人聊天到万人大房的直播互动聊天,从第三方的语音SaaS工具到语音PaaS的SDK,从简单的语音沟通体验到沉浸式的语音体验,游戏语音技术经过了飞速的发展。

要写一个游戏语音发展史,最简单粗暴的就是写个编年体,根据每个语音工具出现的时间顺序来讲述,又或者是从”生物学”的角度出发,讲述语音工具的功能由简单到复杂的进化历程。排除这些分类方法,本文将从另外一个角度出发,即给玩家带来的语音体验方面来介绍游戏语音工具的发展。

心动“香肠派对”的语音模块

游戏语音的最基本体验当然就是玩家通过说话来在游戏进行中相互交流。游戏营造了一个虚拟的世界,玩家的对话实际上是对应游戏中角色之间的对话,随着游戏在玩法设计和音画质量方面的不断提升,玩家对语音的期待也在逐级提高,单纯的电话会议般的语音体验无法再满足玩家的需求,新的革新性技术方案随之出现,我们称之为“沉浸式语音解决方案”

从提供最基本的语音沟通体验,到沉浸式的语音体验,笔者根据游戏语音类产品的体验更迭,将其发展历程分为以下几个阶段:

V1.0:第三方语音工具;

V2.0:游戏内语音;

V2.5:游戏内语音Plus;

V3.0:游戏沉浸式语音;V4.0:全真语音。随着各方面科学技术的发展,比如传感器,强大算力和相关音频算法以及物联网技术的突破,全真语音体验必将最终实现,这也是元宇宙(Metaverse)对语音体验的终极要求。

这就是所谓的游戏外语音工具,它是指玩家在玩游戏过程中通过第三方语聊软件进行语音沟通的方式。比如国外的Skype,TeamSpeak和Discord,国内的微信和YY语音等,甚至还有用在线会议的软件,比如Zoom和Teams来进行游戏开黑的玩家。不管游戏本身是否提供语音功能,利用第三方语音软件进行语音交流都是“万金油”的方法,玩家可以基于其在第三方语音软件的关系链快速和好友建立语音频道进行连麦互动。

Discord这两年受到玩家的追捧,不同于其他的通用第三方聊天软件,Discord专注在游戏语音领域,开发了很多提升游戏社交体验的玩法,比如游戏全屏时Discord语音叠加层,该叠加层用来显示每个玩家的语音状态,试图达到语音和游戏浑然一体的感觉。

但对于第三方聊天工具来说,游戏语音体验的天花板也就在此了,无论语聊工具怎样去设计和优化,语音永远是脱离开游戏场景的,所以最终带给游戏玩家的只能是电话会议般的语音体验。虽然第三方语聊工具给玩家带来的只是基础的语音体验,但考虑到这些软件中的朋友链关系,现在使用第三方语聊软件进行语音开黑还非常普遍。

游戏语音发展到第二代就是游戏内语音解决方案,其主要形式是游戏开发商接入语音PaaS服务商提供的SDK,通过SDK提供的基础API实现各种游戏内语音的业务场景,比如游戏同组队友的频道语音(队友在游戏世界坐标的任何位置都可以进行语音沟通),不同队伍之间的范围语音(敌我玩家只有在游戏世界的位置坐标在一定范围内语音才能被互相听到),语音的黑名单白名单等功能。

不同于第三方的语音聊天工具,第三方语音方案需要游戏开发商的集成和其对于具体的语音场景设计,对于玩家来说,语音频道的建立,通话属性和功能的变化会自动根据游戏进度和场景相适应,从而将游戏语音的体验提升了一个层次。除了实时语音的功能,有些语音SDK,比如GME还提供了更加丰富的API,来满足游戏的其它语音类相关需求,比如语音消息,语音识别,卡拉OK伴奏播放等等,游戏开发商可以基于这些API设计社交属性更强的玩法。

这种游戏内的语音方案已经初步的把语音和游戏的业务场景融合起来,但这基本上还只能停留在功能上的融合,所以这种独立语音SDK的方案带给玩家的体验依然如电话会议一般,只不过是不需要玩家自己建立聊天频道了,不需要额外运行第三方软件消耗资源了。

为了进一步提升玩家的语音体验,包括GME在内的一些语音SDK提供了比如变声和虚拟3D声场的语音处理能力,玩家可以在集成了这些功能的游戏中切换自己的声音类型,瞬间就可把自己的声音实时变成可爱萝莉声,憨憨大叔声,机器人金属质感声等,这不但增加了游戏的趣味性还为游戏提供了新的玩法设计空间。

趣味变声

3D空间感语音

对于FPS,大逃杀和VR这类游戏,从玩家交流战术的角度和游戏对玩家的代入感两方面来讲,听声辨位都是一个很强的需求,语音SDK提供的3D虚拟化技术很好的解决了这个问题,玩家之间根据语音感知的方位和他们在游戏中角色的相对位置相对应,并且随着游戏角色间相对距离的变化,语音的强度也会随之增强和衰减,这很好的仿真了人们在真实环境下的语音对话感受。

虽然3D虚拟化技术实现了语音处理和游戏实际场景的结合,但这种结合也只是局限于游戏场景中位置和距离相关的信息。真正的沉浸式体验要实现语音处理对应游戏场景的方方面面,语音SDK不可能单独为每种可能的因素都提供专属API,如果这样做的话,语音SDK会变得非常复杂且硕大无比,而且也没有必要这么做。那如何才能打破天花板进一步提升游戏语音体验呢?我们需要全新的解决方案,即游戏沉浸式语音方案。

所谓沉浸式语音方案就是玩家在游戏中的实时语音渲染完全随着实际游戏的进程来调整,每个玩家语音经过各种DSP算法的处理,再通过耳机回放出来的体验完全模拟了大家在真实环境下语音沟通的效果,这样沉浸式的处理将游戏语音的体验提升到了新的高度,让玩家交流起来“不出戏”。

Wwise-GME联合沉浸式语音解决方案

那沉浸式语音方案怎么实现呢?如上一段描述的,由语音SDK提供各种API是得不偿失的,而且语音服务提供商在音频处理算法领域一般也属于外行,肯定没有专业的音频公司做的效果好,所以开发大而全的语音SDK几乎是不可行的。

基于这种考虑,强强联手是最佳的解决方案,比如Wwise + GME方案,GME专注于端到端的实时语音通信,Wwise作为业界知名的游戏互动音频引擎,被很多游戏开发商作为游戏音效设计的工具,GME和Wwise音频引擎之间以Wwise插件作为桥梁进行数据交互,GME的语音流无缝的接入Wwise音频管线,这样Wwise上丰富的音效处理和控制都可以运用到语音,正是基于这样的设计,为游戏提供沉浸式语音体验才成为可能。

Wwise作为游戏互动音频的创作工具,一般是用来创作高质量的游戏音频内容,GME填补了Wwise在语音领域的一个空白,现在游戏音效师同样可以用Wwise来创作沉浸式的语音和有趣的语音玩法,这个想象空间被打开了。关于Wwise + GME方案的介绍和其能给游戏带来的创新玩法可以参考笔者的另一篇文章《Wwise + GME游戏语音方案:解锁更多语音玩法,让玩家“身临其境”》。

游戏语音的体验发展到沉浸式语音就到头了吗?当然不是,全真语音才是最终的天花板。

随着各种R(AR/VR/MR...)技术的发展,如今元宇宙(Metaverse)的概念非常火爆,业界都认为它将是互联网的下一个十年的风口,很多科技巨头都开始在这个领域布局。所谓元宇宙,就是一个平行于现实世界的人造虚拟网络世界,虚拟世界既独立又与现实世界互通,人们可以在其中进行社交甚至工作。

为了让人在虚拟世界中拥有真实世界的感觉,需要各种软硬件技术配合来模拟人类各个感官的体验,语音交流作为人类社交的重要组成部分,元宇宙的场景对其会有更高的要求,这就是所谓的全真语音,目前元宇宙给我们的更多的还是想象,让我们拭目以待科技的发展吧!

对于大部分游戏类型,语音虽然不是游戏的核心功能,但游戏作为网络时代的一个重要社交平台,语音功能不但会给游戏增色很多,而且还可以提升玩家在游戏中的留存度,所以现在语音基本上已经成为了网络游戏的标配功能。

纵观游戏语音的发展历程,语音的技术演变是随着玩家日益增长的体验需求和玩法需求而发展的,文中没有真正的从“历史”角度来介绍语音工具的发展,而是从语音带给玩家的体验提升角度将其发展分为四大阶段。随着人们对游戏期望的越来越高,相信语音会在游戏中起到越来越大的作用。

如果您有相关业务需求或想要进一步了解相关产品内容,欢迎扫描下方二维码添加音视频小姐姐微信,与我们的产研团队深入沟通交流。

腾讯云音视频在音视频领域已有超过21年的技术积累,持续支持国内90%的音视频客户实现云上创新,独家具备腾讯云RT-ONE™全球网络,在此基础上,构建了业界最完整的 PaaS 产品家族,并通过腾讯云视立方 RT-Cube™ 提供All in One 的终端SDK,助力客户一键获取众多腾讯云音视频能力。腾讯云音视频为全真互联时代,提供坚实的数字化助力。

相关推荐

365bet手机在线 狂送28天!还有浓郁年味、绝美外观、全新玩法都要来了【新春版本终极预告】
mobile365体育投注英超 vivox7怎么截屏

vivox7怎么截屏

📅 07-03 👁️ 7507
mobile365体育投注英超 宽短指甲适合什么美甲(宽短指甲适合什么美甲颜色)