新技术赋能有声读物的发展路径研究——以喜马拉雅FM为例
蒋娅茹 傅乃芹
昆明理工大学艺术与传媒学院
摘要:本文对有声读物相关理论以及我国有声读物的发展困境进行了概述,同时采用案例分析法,分析了5G、区块链、云计算、人工智能等新技术对有声读物在产品生成、版权保护、商业变现以及产业架构方面的适用性和可行性,并基于新技术功能战略探讨了本土有声读物的发展路径,旨在优化有声读物的发展路径,实现技术平台双效发展。
关键词:新技术;有声读物;路径创新;喜马拉雅FM
一、引言
随着互联网的不断发展,以海量数据为基础、多层次信息划分与推送为出发点、三维网站基点用户运营为表现形式、全动态营销分发为最终呈现的新技术不断涌现,其中,应用最为广泛的有5G技术、区块链技术、云计算技术、人工智能技术。为了适应时代的发展,传统出版行业不断探索与新技术的融合发展,并在此基础上发展出较为完善的数字出版产业形态,从而衍生出继纸质书、电子书之后的第三大图书形式——有声读物。本文以我国有声读物的龙头产业喜马拉雅FM平台为例,从5G技术创新内容生产、区块链技术建立数字版权信用范式、云计算技术提升产业变现能力以及人工智能技术实现产业链流程协同与再造等方面,探讨了新技术赋能有声读物的适用性和可行性。
二、有声读物相关理论综述
(一)有声读物的概念
1934年,美国学者提出了“有声读物”这一概念,美国有声出版协会认为,“包含不低于51%的文字内容,复制和包装成盒式磁带、高密度光盘或者单纯数字文件等形式进行销售的任何录音产品”都可以被称为“有声读物”。90年代初期,我国首次界定了有声读物的概念,百度百科对有声读物的定义为“运用现代数字技术,以文字作品为内容,固定单个或多个表演者声音并存储于数字文件之中,利用网络平台向公众传播的音频产品”,常见的有声读物格式为录音带、CD、数位档广播磁带等。
(二)我国有声读物的发展
我国有声读物兴起于1994年,直到2000年北京鸿达以太公司研制出MP3格式的有声读物,可移动有声读物才初见雏形。2003年,该公司创办了国内首家听书网站“听书网”。2012年以后,随着互联网技术的飞速发展,我国有声读物开发开始进入爆发式增长期,截至2023年12月30日,最具代表性的听书平台主要有喜马拉雅FM、懒人听书、荔枝FM、鸿达以太4个,它们在有声读物制作与发行存量市场中所占的份额分别为54%、27%、21%和44%。共研网发布的《2021-2023年中国有声读物市场调查与投资战略报告》显示,从人均消费来看,2023年中国有声读物行业人均消费金额达27.63元/人,较2022年增加了0.82元/人,同比增长2.8%,2024年中国有声读物行业人均消费金额突破27.12元/人;从市场规模来看,2023年中国有声读物行业市场规模达97.4亿元,较2022年增加了10.6亿元,同比增长8.2%,预计2024年中国有声读物行业市场规模将达到127.7亿元
三、我国有声读物的发展困境
随着数字化浪潮的到来,后视觉时代逐渐发展,我国本土有声读物在新技术的赋能下开始快速发展。智研咨询发布的《2023-2029年中国有声读物行业发展现状调查及前景战略分析报告》显示,2023年中国数字出版产业规模超过12300亿元,同比增长幅度约为36.25%,占GDP比重约为1.72%,相比2022年增加了8个基点。数字经济的更新迭代不断刺激着有声读物行业的发展,与此同时,基于传统出版产业链而发展的有声读物,在产品架构、版权保护、产业盈利和产业链架构方面却表现出与快速发展的数字出版经济间较大的不适配性。
(一)产品生产:多维度内容整合欠缺
1.单人无法兼顾产品全内容制作
传统有声读物内容生产主要采用UGC模式(用户生产内容),该模式伴随着以提倡个性化为主要特点的Web2.0概念而兴起,用户可以将自己原创的内容通过互联网平台进行展示或者提供给其他用户,他们既是内容的生产者,又是内容的发布者。虽然这在一定程度上保证了作品的原创性,但是就完整的出版流程来说,一个人是无法在进行内容创作的同时兼顾文稿校对、音频配对以及后期平台发布等工作。
2.用户即兴制作内容缺乏可持续性
UGC内容生产模式的主要驱动力在于用户分享的动机、低用户准入机制的有声读物平台运营,以及对用户制作与专业水准显示出极大的包容性。但是,内容质量参差不齐、版权纠纷不断产生、生产动力不足等问题,使得UGC内容生产缺乏可持续性。
(二)版权保护:多层次制度理念缺乏
1.网络平台存在盗版现象
数字出版利用计算机技术、互联网技术对有声读物进行数字整合、加工、协同再造,从而流向用户,极大地改变了人们的阅读模式。尽管高精度计算机技术协同音频、视频再造,为有声读物的制作提供了较大的便捷,但是制作技术的日新月异也滋生了作品侵权问题。比如,一些网站未经著作权人同意,擅自对其文学作品进行配音并上传到网络中;未与著作权人沟通获得授权便对其图片、音频、文字等进行转载,甚至不标注来源。这些行为对著作权人造成困扰的同时,也极大地影响了他们的创作积极性。
2.“拿来主义”思维定势逐渐形成
互联网时代,为了在市场中占据一席之地,各大有声读物平台在建立之初便利用“免费、海量”等词吸引用户关注,并为他们提供了大量的视频、音频等,长此以往,“拿来主义”便深入人心,导致部分用户逐渐认为免费才是理所当然,甚至短时间内难以改变这种思维。《工人日报》有关调查显示:“目前,网络侵权行为的被举报率只占全国违法统计举报率的3%左右,文学作品则处于网络侵权的重灾区,很多作者和读者面对侵权更是习以为常。”
(三)商业变现:盈利渠道较为单一,缺乏发展动能
早期有声读物是以磁带、CD或者光盘为载体进行传播的,但是其存在制作过程耗时较长、成本较高等问题,很多出版商逐渐减少了相关投入,开始注重移动听书APP的发展。近年来,随着移动互联网的快速发展,加之智能手机、电子阅读器等移动终端的普及以及5G网络的优化提升,让人们随时随地地阅读有了更多可能。从产业变现来看,虽然目前有声读物概念已经通过车载音频、可穿戴设备被更多受众了解,但是尚未形成完整的有声阅读盈利闭环,盈利方式仅限于内容的输出与重构,盈利渠道较为单一。从商业变现的角度来看,平台运营商投入大量资金用以技术支撑和产业运营,缓慢的商业变现速度难以维持高消耗的产业发展,投入产出不成比例,较大地影响了市场发展动能。
(四)产业链架构:移动平台终端构建不完善
早期我国有声读物产业发展模式表现为“厂商→零售商店→用户”,属于单一线性零售模式。随着互联网技术的产生,传统线性模式开始发生较大地改变,用户收集处理信息的量、对信息分解的深度以及信息关联的量,都因为移动终端及其附带的应用软件呈现出几何级别的增长,数字化的有声产品开始在移动端聚集与传播,极大地提升了用户的参与度。此时,有声读物产业的发展模式具体表现为“厂商→移动端→用户”。随着各大移动听书平台的兴起与发展,未来有声书产业的发展渠道重心应更多地放在“基础功能+核心矩阵+用户关联+衍生聚合”的移动平台终端上。
四、新技术赋能有声读物创新发展
喜马拉雅FM平台于2012年成立,2013年上线手机移动端APP,截至2023年12月,用户规模超7.8亿,累计包含127个品类的3.5亿条音频内容,成为我国发展速度最快,发展规模最大的音频分享平台。作为我国音频行业的龙头企业,喜马拉雅的成功离不开平台不断探索新兴技术的融合发展。
(一)5G技术:多功能加持,打造全品类音频聚合平台
1.增强带宽,重构内容生产模式
5G技术突出的带宽增强特点,可以让平台灵活部署业务。比如,喜马拉雅FM平台推出的内容生产PUGC模式(专业用户生产内容),实现了UGC(用户生产内容)和PGC(专业生产内容)的双重结合,既有UGC的深度,又有PGC的广度。2017年5月6日,喜马拉雅FM平台推出的5.4.99版本支持名师评价,允许用户与主播连麦;在推广“草根主播”的同时,邀请多位自媒体大咖“空降”配音团,共同创建“微创业”项目,极大地丰富了有声读物的内容。
2.低时延、高可靠,实现内容整合即时化
5G技术自动整合有声读物的数据、内容、评价、反馈,形成完整的内容生产回流闭环,推动有声读物出版提质增效。低时延、高可靠的特点能够将有声读物内容整合的时长确保在1-10毫秒,音频辨析度在4-8k。与此同时,还能对用户注册的信息进行整合,生成完整的数字画像,进而实现精准的内容推送。
3.超密集网络异构特点,打造全品类音频聚合平台
2017年8月21日,喜马拉雅FM平台推出的6.3.15版本增加了精品页分类导航功能,推出定制节目以及定集关闭(按集数定时关闭)、趣配音、网商直播go等栏目时,借助5G超密集网络异构技术实现了软件定义网络全覆盖,实时进行数据处理,解决同频干扰;在各个网络节点上实行分布式数据存储,并在此基础上形成用户知识图谱,达成共识机制,以便实现点对点传输,进而将自身打造成集有声书、知识付费、娱乐、音频直播、电商合作为一体的全品类音频聚合平台。
(二)区块链技术:提升数字兼容,建立版权信用范式
1.去中心化分布,提升数字兼容性
区块链技术的去中心化分布表现为各架构层节点信息处理的独立性,即软件间运作的异构性。作为比特币的底层技术支持,数字平台可以在此基础上添加新的编辑器和处理器而互不干扰,实现协同作业。2017年11月8日,喜马拉雅FM平台推出的6.3.36版本允许通过人脸识别注册登录,并将个人ID作为单独链接入口进行内容制作与分发;homePod组合可以自动感应声源位置,主动进行音频调整以适应环境变化。
2.哈希加密算法,建立版权信用范式
区块链技术的加密特点保证了有声读物版权的不可篡改性,运营商利用其存证机制和哈希算法,可以将同一平台内的数字作品与版权流转记录等信息计入区块链中,时间戳与哈希根值可以为收益分配提供数据支持。2017年,喜马拉雅FM平台引入加密算法,制定排他性文件:在有声读物创作初期与著作权人签订智能合约(if-then模式,触发关键词合约自动生效);中期联合发布平台签署媒体元数据协议;后期进行加密发布,一次性买断版权衍生改编,构筑其版权壁垒。
3.超强延展性,确保版权交易灵活性
区块链技术自带的可编辑脚本系统会根据不同数字代码的整合适配不同形态的版权交易形式,超强的自我延展性能够确保区块链各节点独立工作,并有针对性地处理问题。同时保留一些存储、能源、算力等资源,而不是在冗余的复制上浪费资源,以此实现对有声读物的零知识证明及密钥保护,完成版权的提前交易。因此,著作权人在进行版权交易的同时可以自发进行系统编辑,确定作品的用途和方向;服务商可以就投资交易需求与著作权主体达成交易,并且实时跟踪版权内容的使用情况,及时发现并制止非法使用行为。
(三)云计算技术:云端整合提升商业变现能力
1.虚拟化VIP模式,实现社群服务变现
2016年是我国的知识付费元年,喜马拉雅FM平台借势开展了“66会员日”活动,截至2016年6月6日20时,其会员数量超过221W;截至2016年6月8日24时(活动结束当天),共召集会员342W+,产生知识消费6114万元。2017年6月3日,喜马拉雅FM平台推出6.3.6版本,上线巅峰会员并强调会员专享免费听书8大特权。2017年8月21日又推出6.3.15版本,再次更新了会员的有声广告特权。比如,通过免除部分广播电视内置广告的方式,让会员享有无限量的下载特权;利用会员折扣吸引用户购买平台商品等形式,将社群中最活跃和最有归属感的粉丝聚集在一起,进一步增强专属圈子的黏性,为会员提供专属的社群增值服务;通过各种运营活动吸引潜在用户注册,实现社群服务变现。
2.高可靠性操作流程,实现注意力经济变现
当下,最重要的资源既不是传统意义上的货币资本,又不是信息本身,而是大众的注意力。随着有声读物的平台化发展,出版交易表现出较大的虚拟性,因而平台操作流程越可靠,用户注意力就越聚集。云技术赋能下喜马拉雅FM平台有声读物的出版表现出高可靠性:用户通过搜索页面输入动态请求驱动计算机服务器,服务器根据用户提交的请求调配计算机网格计算法进行本地演算,机械智能推理复杂运算、分析用户需求,根据结果调配储存在“云端”上的资源,并将结果提供给用户。基于Synereo的变现工具削弱了内容创作者对广告商收入及其议程的依赖性,为内容创作者、价值传播者和内容接受者提供了直接的激励,从而实现注意力经济的直接变现。
3.低成本准入机制鼓励全民参与,实现粉丝流量变现
为了实现出版内容数字化运营,喜马拉雅FM平台在创建之初便在后台引入了云计算模式,用户不需要额外付费就可以使用该模式。比如,2018年2月23日,喜马拉雅FM平台推出6.3.63版本并开设“你说我听”栏目,用户可以自行选择项目进行配音,不需要支付任何报酬便可获得专业配音人员的指导,极大地提高了用户创作的积极性;2018年3月28日,喜马拉雅FM平台又推出6.3.72版本并开设优质主播工作台,邀请明星空降直播间,创建直播商城,构建“动态+圈子+评论”三合一粉丝社群,利用粉丝流量实现了有声书的推广与传播。
(四)人工智能技术:人机混合强化智能管理、完善产业链
1.自动化程序设置,实现产业平台化整合
我国有声书产业兴起之时,以Audiobooks等网络平台为主要出版渠道。随着互联网技术的进一步发展,平台的联结作用与经济生态系统相融合,形成了新型商业模式,平台经济应运而生。2012年,喜马拉雅FM平台的创立成为从传统有声书线性发展模式转变为用户平台双协作模式的新切口,人工智能的自动化设置程序进一步提升了平台的自我整合与运转能力,形成了上游PUGC模式内容生产、中游产品运营与开发、下游多元终端产品出版的产业链。同时用户供给侧的过剩产能和闲置资源通过平台再匹配衍生出共享经济,产生新的动能,从而促进产业循环发展,形成完整的产业平台发展闭环。
2.增强智能审核功能,提升有声读物出版全流程的便捷性
喜马拉雅FM平台引入人机混合机制增强了智能审核功能,在内容生产上,从源头进行声画对位匹配和音质校对,从而确保作品的准确性和专业度;在上传内容时,自动审核产品版权后触发智能合约,保护著作权人的合法版权;在内容发布后,自动对作品进行水印处理和密钥封存。
五、结语
技术的进步与普及为有声读物市场发展提供了肥沃的土壤,以技术为依托进行有声读物出版成为市场主流,有声出版进入了“快车道”。未来,有声出版会通过技术的创新与再赋能不断完善内容生产和数字版权保护机制,以打造优质内容为核心导向,实现盈利变现和产业链重构,形成多领域发展的大趋势。