回到顶部

RTC Dev Meetup丨语音处理在实时互动领域的技术实践和应用(第一场)

2022年4月28日 14:00 ~ 2022年4月28日 16:30
线上活动 (活动行Live)

收起

活动票种
    付费活动,请选择票种
    展开活动详情

    活动内容收起

    实时互动作为下一代技术基础能力,正在渗透各行各业。尤其是受疫情的影响,人们越来越习惯在线、远程的工作、学习甚至生活。同时社交直播、游戏电竞、金融、保险、医疗等场景也被搬到了线上,实时互动正在支撑着这些人、物及空间之间创新的沟通和交互方式。

    在实时互动场景中,语音处理是非常重要的一个部分,比如实时语音识别和实时语音翻译,可以将连续的音频流实时转换成文本,并进行实时翻译,应用在直播实时字幕、会议实时记录等场景,可以大大提高用户体验和沟通效率。

    本次,我们邀请了语音处理方面的技术专家,为大家分享语音处理在实时互动领域的最佳技术实践和业务应用。本次,我们邀请了来自百度、讯飞、依图、微  软、声网、数美等企业的语音处理方面的技术专家,分别在4月28日、5月14日为大家分享语音处理在实时互动领域的最佳技术实践和业务应用,欢迎大家报名参与~~

    时间地点

    活动时间:4 月 28 日(星期四) 14:00——16:30

    活动地点:线上直播

        

    活动流程

      14:00-14:10   开场

      14:10-14:50  《百度文心大模型在语音文本审核中的应用》黄硕,百度自然语言处理部主任研发架构师

      14:50-15:30 《语音识别技术研究进展和应用落地分享》马志强,寰语科技语音识别研究主管                    

      15:30-16:10 《实时音视频中语音处理的挑战》周元剑,依图AI SaaS技术负责人

      16:10-16:30   抽奖

     

    嘉宾一

    1.jpg

    黄硕 百度自然语言处理部 主任研发架构师

    分享主题

    百度文心大模型在语音文本审核中的应用

    个人简介:

    百度自然语言处理部主任架构师。十余年搜索、推荐和人工智能技术研发经验,先后在百度、腾讯、Facebook等多家公司从事搜索、个性化推荐、自然语言处理技术研发工作,在人工智能技术应用方面有丰富的实战经验;曾主导百度搜索个性化技术研发并在十多个产品线应用投产,并深度参与百度深度学习框架在企业中的推广应用。目前在百度自然语言处理部负责NLP基础技术研发、AI技术产业化应用等方向。

    内容简介:

    深度学习预训练大模型最近几年发展迅速,颠覆了很多以往使用传统机器学习技术解决的领域。得益于大模型技术在百度的发展,语音文本审核这项互联网传统业务在技术上也有了较大的发展。本次分享将在大模型相对传统模型的整体效果、通用性、个性化需求适配以及服务性能上进行介绍和展开,希望让听众了解大模型的优势,以及审核技术最新的一些发展趋势和业务应用效果。

     

    嘉宾二

    2.jpg

    马志强,寰语科技语音识别研究主管

    分享主题

    语音识别技术研究进展和应用落地分享

    个人简介:

    马志强,寰语科技语音识别研究主管,主要负责语音识别核心技术研究和相关产品落地工作,具备语音识别、语音转写及语音翻译技术研发经验,熟练掌握ASR技术、NMT技术、深度学习技术等,在多语种、低资源、端到端语音识别方向有着丰富的实践经验,对AI语音识别技术的产业应用有着深入的理解,负责并推动了ASR技术在语音助手、语音交互、AI字幕等场景上线应用。

    内容简介:

    语音识别技术研究进展和应用落地分享,第一部分简要介绍AI语音识别技术的发展态势和技术研究现状以及面临的挑战问题;第二部分重点介绍语音识别技术的发展历程及其技术原理,重点讲解ASR技术的最新研究进展和技术突破,特别是在语音助手、AI字幕场景的系统性创新工作;第三部分主要介绍ASR技术的应用落地情况,以及AI语音在各个领域场景所取得的应用成果。

     

    嘉宾三

    3.jpg

    周元剑,依图AI SaaS技术负责人

    分享主题

    实时音视频中语音处理的挑战

    个人简介:

    从依图公司成立至今,一直在其任职,参与过多款AI产品研发和多个大型智能化项目建设落地。现担任依图AI SaaS技术负责人,目前主要聚焦在语音识别、内容审核方向。

    内容简介:

    依图ASR和NLP的能力表现;ASR场景有挑战的地方;依图在通用场景如何解决的这些问题;实时音视频领域遇到的典型问题;多语言模型的面临的挑战等。


    活动福利

    报名直播参与活动,即有机会领取本次精美声网周边,心动不如行动,扫码报名本次活动吧!

    wecom-temp-686a57a8055876a013a57e1255fc13fb.png



    活动社群

    企业微信截图_469583b0-fdbb-4365-878a-a82aa147f87a.png

    扫码进入👆开发者交流群,会后可以获取PPT等会议资料

    提示:直播需要报名后才可以观看

    活动主办

    图片


    合作伙伴

    WechatIMG2638.png


    举报活动

    活动标签

    最近参与

    • 报名

      (2年前)

    • 微信用户
      报名

      (2年前)

    • Brandy
      报名

      (2年前)

    • 微信用户
      报名

      (2年前)

    • Sigurd
      报名

      (2年前)

    • care
      报名

      (2年前)

    您还可能感兴趣

    您有任何问题,在这里提问!

    为营造良好网络环境,评价信息将在审核通过后显示,请规范用语。

    全部讨论

    还木有人评论,赶快抢个沙发!

    活动主办方更多

    RTE 开发者社区

    RTE 开发者社区

    RTE 开发者社区是由声网及实时音视频开发者共同发起和运营的中立技术社区。 2015 年,代表实时互动最前沿技术的 RTC 大会从美国开到了中国。我们决定让这种聚会不局限于一年一度的线下大会,因此发布了 RTE 开发者社区。此后一年一度的 RTE 大会成为实时互动开发者的年度盛会,同时 RTC 开发者社区成为实时互动技术领域数万名开发者共同建设的技术社区。 我们的宗旨是:I came,I saw,I fixed。
看见问题,随手回答;看见 bug,随手修复。这是每一个极客的信条。 RTE 开发者社区和大家一起共同成长、交流,和你一起解决技术难题。

    微信扫一扫

    分享此活动到朋友圈

    免费发布