一种基于跨平台的实时字幕展示方法和管理系统与流程

专利2022-06-29 60

本发明涉及通讯技术领域，尤其涉及一种基于跨平台的实时字幕展示方法和管理系统。

背景技术：

目前，人们在办公、会议、ppt演讲时，都希望演讲者或者会议参与者能够将所说的话通过录音设备进行录入，并实时的在屏幕上进行实时字幕展示。这样既可以听到发言人的声音，也可以看到实时字幕，参会者能够更加直观的理解发言人想要表达的内容，让会议和演讲更加高效。并且在会议结束后，往往也需要一份会议纪要，去记录参会人员的发言内容和音频，留作存档和参考依据。

现有的实时字幕展示技术一般都是由一整套系统配套进行展示，这种系统无法直接单独使用，往往需要同时购买多个录音设备和字幕展示设备进行配合使用，这样开支又很大，很多企业无法负担。如果只通过一个设备，既进行音频接收，又进行字幕展示。若存在多个发言人，则无法将发言人与字幕一一对应，这样进行整理会议内容时，有时会将人员发表的内容混淆，不利于字幕内容的整理。

技术实现要素：

本发明的目的是为了解决现有技术中的问题，而提出的一种基于跨平台的实时字幕展示方法和管理系统。

为了实现上述目的，本发明采用了如下技术方案：

一种基于跨平台的实时字幕展示方法和管理系统，包括录音模块、语音识别模块、通信模块、设备绑定模块、通信模块、字幕展示模块、字幕分享模块、设备控制模块与文件管理模块，

所述录音模块，用于监测终端设备的录音数据；

所述语音识别模块，接收录音模块的音频数据，将音频数据通过语音识别技术转化为文本信息；

所述通信模块，如果设备在局域网可以接收设备绑定模块发出的绑定广播进行设备绑定；

所述设备绑定模块，在局域网中可以发送绑定广播；

所述通信模块，可以通过设备绑定模块与音频采集程序中的通信模块建立网络通信连接；

所述字幕展示模块，可以接收通信接收模块传回的文本信息；

所述字幕分享模块，将实时字幕信息发送给中转服务器并通过生成二维码的形式进行字幕分享；

所述设备控制模块，可以发送设备控制信息给通信模块；

所述文件管理模块，接收通信模块的文本文件和音频文件，并储存在设备上。

在上述的一种基于跨平台的实时字幕展示方法和管理系统中，包括以下步骤：

s1：在可以进行录音的设备上安装音频采集程序；

s2：在需要进行字幕展示的展示设备上安装字幕展示程序；

s3：建立字幕展示程序和音频采集程序的通信连接；

s4：录音设备上的音频采集程序监测设备的实时录音数据，并通过语音识别将模块音频字节转化为文本信息；

s5：音频采集程序将文本信息通过通信链接传输给展示设备上的字幕展示程序；

s6：字幕展示程序将接收的文本信息进行处理后转化为字幕展示在展示设备上，并可以进行字幕分享；

s7：通过字幕管理程序可以控制音频采集程序和查看历史字幕和播放对应的音频文件。

与现有的技术相比，本发明优点在于：

本发明提供一种基于跨平台的实时字幕展示和管理系统，该系统可以应用于办公、会议、ppt演讲场景，并且只需要相应的软件程序。利用各种终端设备，例如手机、平板、智能麦克风、笔记本电脑作为音频采集设备，在需要进行字幕演示的设备上安装字幕管理程序，将设备接入网络，就可以进行字幕展示，字幕分享以及字幕管理，使用成本很低，极为方便，实时字幕展示的环境也很好搭建。

附图说明

图1为本发明基于跨平台的实时字幕展示方法的流程图。

图2为本发明基于跨平台的实时字幕展示系统的结构图。

图3为本发明基于字幕文件保存管理方法的具体流程图。

图4为本发明基于字幕二维码分享方法的具体流程图。

图5为本发明基于实时字幕展示系统三种通信方法的具体流程图。

图6为本发明基于实时字幕展示系统三种通信方法的具体流程图

图7为本发明基于实时字幕展示系统三种通信方法的具体流程图。

图8位本发明基于实时字幕展示系统传输方法的具体流程图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。

在本发明的描述中，需要理解的是，术语“上”、“下”、“前”、“后”、“左”、“右”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。

一种基于跨平台的实时字幕展示方法和管理系统，一种基于跨平台的实时字幕展示方法和管理系统，包括录音模块、语音识别模块、通信模块、设备绑定模块、通信模块、字幕展示模块、字幕分享模块、设备控制模块与文件管理模块，

录音模块，用于监测终端设备的录音数据，并将音频字节传输给语音识别模块；

语音识别模块，接收录音模块的音频数据，将音频数据通过语音识别技术转化为文本信息，先将实时文本信息传输给通信模块，之后将音频文件和文本文件一并传递给通信模块；

通信模块，如果设备在局域网可以接收设备绑定模块发出的绑定广播进行设备绑定，如果设备在广域网可以给中转服务器发送网络地址信息，从而与通信模块建立局域网通信连接或广域网通信连接，并将文本信息和音频文件、文本文件传输给通信模块；

设备绑定模块，在局域网中可以发送绑定广播，终端设备的音频采集程序接收到绑定广播后，可以进行设备绑定，绑定成功后两个设备即开始进行通信。在广域网中可以给中转服务器发送网络地址信息，并从中转服务器绑定其他音频采集程序；

通信模块，可以通过设备绑定模块与音频采集程序中的通信模块建立网络通信连接，并进行数据交换，将接收到的数据传递给字幕展示模块、设备控制模块、文件管理模块；

字幕展示模块，可以接收通信接收模块传回的文本信息，将文本信息进行切分和合并转化为字幕展示在展示设备上；

字幕分享模块，将实时字幕信息发送给中转服务器并通过生成二维码的形式进行字幕分享，扫描二维码后，打开对应网址并查询中转服务器中的信息，显示出实时字幕文本信息；

设备控制模块，可以发送设备控制信息给通信模块，并对音频采集程序进行一定的控制；

文件管理模块，接收通信模块的文本文件和音频文件，并储存在设备上,用户可以查看历史的文本数据和音频数据；

其中具体的实施步骤如下：

s1：在可以进行录音的设备(手机、平板、笔记本电脑)上安装音频采集程序；

s2：在需要进行字幕展示的展示设备(电脑端)上安装字幕展示程序；

s3：建立字幕展示程序和音频采集程序的通信连接；

s4：录音设备上的音频采集程序监测设备的实时录音数据，并通过语音识别将模块音频字节转化为文本信息；

s5：音频采集程序将文本信息通过通信链接传输给展示设备上的字幕展示程序；

s6：字幕展示程序将接收的文本信息进行处理后转化为字幕展示在展示设备上，并可以进行字幕分享；

s7：通过字幕管理程序可以控制音频采集程序和查看历史字幕和播放对应的音频文件。

值得注意的是：网络通信连接首先进行局域网通信，若无法通信则进行广域网通信；

值得注意的是：一个字幕管理程序可以和多个音频采集程序建立网络通信链接，同时接收多个设备的文本信息并进行字幕展示。

其中对文件保存管理的方法如下：

s：对采集的音频进行语音识别，并将识别的每一段字幕信息添加开始时间和结束时间；

s2：将识别的字幕信息和音频数据整理成字幕文件和音频文件并添加关联信息，最后打包成压缩包；

s3：通过网络传输给字幕管理系统的文件管理模块；

s4：文件管理模块进行解压缩，并解析对应的字幕文件和音频文件；

s5：通过文件管理模块查阅对应的实例字幕和播放对应字幕的音频文件。

其中对字幕二维码分享方法如下：

s1：字幕管理程序将实时字幕信息传递给服务器；

s2：服务器接收实时字幕信息，并进行存储；

s3：服务器为对应程序的字幕信息生成对应网址；

s4：将网页链接生成对应的二维码；

s5：服务器将二维码传递给字幕管理程序；

s6：字幕管理程序展示二维码；

s7：扫描二维码后跳转到对应网页。

如图5,6,7所示，实时字幕展示系统三种通信方法，包括以下：

通信方式一：局域网通信

s1：用户登录终端程序和展示端程序；

s2：终端程序和展示端程序向服务器发送心跳数据与服务端建立连接；

s3：展示端向局域网中发送广播；

s4：终端程序回复广播；

s5：终端设备向展示段和服务端发送字幕数据；

s6：终端程序向展示端发送tcp请求；

s7：展示端同意连接后向展示端发送音频文件和文本文件。

通信方式二：广域网udp通信

s1：用户登录终端程序和展示端程序；

s2：终端程序和展示端程序向服务器发送心跳数据与服务端建立连接；

s3：展示端向局域网中发送广播，终端设备未回复广播；

s4：展示端向服务端请求连接对应账户的终端；

s5：服务端返回对应账户登录的终端设备ip；

s6：展示端通过ip地址向终端程序请求udp连接；

s7：终端程序同意连接后，通过udp连接向展示端发送字幕数据，通过http向服务端发送字幕数据；

s8：终端程序向展示端请求tcp连接；

s9：展示端同意tcp连接，终端程序发送音频文件和文本文件给展示端。

通信方式三：服务器中转通信

s1：用户登录终端程序和展示端程序；

s2：终端程序和展示端程序向服务器发送心跳数据与服务端建立连接；

s3：展示端向局域网中发送广播，终端设备未回复广播；

s4：展示端向服务端请求连接对应账户的终端；

s5：服务端返回对应账户登录的终端设备ip；

s6：展示端通过ip地址向终端程序请求udp连接；

s7：终端程序未返回udp消息；

s8：展示端通过http发送字幕数据给服务端；

s9：服务端将同账户的字幕数据传输给展示端；

s10：展示端通过http发送音频文件和文本文件给服务端；

s11：展示端向服务端请求同账户下的文件数据；

s12：服务端向展示端发送文件数据。

其中字幕展示系统的传出方法如下：

s1：字幕管理程序作为服务器端，初始化tcp服务；

s2：字幕管理程序将网络地址(ip和port)发送给音频采集程序；

s3：音频采集程序解析字幕管理程序网络地址，并给字幕管理程序发送tcp绑定请求；

s4：字幕管理程序解析音频采集程序的请求，保存终端设备信息；

s5：字幕管理程序检测与音频采集程序的连接是否超时，如果未超时，进入s7；

s6：如果连接超时，则保存日志并显示音频采集程序断开连接；

s7：字幕管理程序与音频采集程序进行文件数据传输；

s8：如果文件传输超时，则保存日志并显示音频采集程序断开连接；如果没有超时，则进入s9；

s9：如果文件传输完成，则断开连接，并结束。否则重新进入步s7。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。

以上所述，仅为本发明较佳的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，根据本发明的技术方案及其发明构思加以等同替换或改变，都应涵盖在本发明的保护范围之内。

技术特征：

1.一种基于跨平台的实时字幕展示方法和管理系统，包括录音模块、语音识别模块、通信模块、设备绑定模块、通信模块、字幕展示模块、字幕分享模块、设备控制模块与文件管理模块,其特征在于，

所述录音模块，用于监测终端设备的录音数据；

所述语音识别模块，接收录音模块的音频数据，将音频数据通过语音识别技术转化为文本信息；

所述通信模块，如果设备在局域网可以接收设备绑定模块发出的绑定广播进行设备绑定；

所述设备绑定模块，在局域网中可以发送绑定广播；

所述通信模块，可以通过设备绑定模块与音频采集程序中的通信模块建立网络通信连接；

所述字幕展示模块，可以接收通信接收模块传回的文本信息；

所述字幕分享模块，将实时字幕信息发送给中转服务器并通过生成二维码的形式进行字幕分享；

所述设备控制模块，可以发送设备控制信息给通信模块；

所述文件管理模块，接收通信模块的文本文件和音频文件，并储存在设备上。

2.根据权利要求1所述的一种基于跨平台的实时字幕展示方法和管理系统，其特征在于，包括以下步骤：

s1：在可以进行录音的设备上安装音频采集程序；

s2：在需要进行字幕展示的展示设备上安装字幕展示程序；

s3：建立字幕展示程序和音频采集程序的通信连接；

s4：录音设备上的音频采集程序监测设备的实时录音数据，并通过语音识别将模块音频字节转化为文本信息；

s5：音频采集程序将文本信息通过通信链接传输给展示设备上的字幕展示程序；

s6：字幕展示程序将接收的文本信息进行处理后转化为字幕展示在展示设备上，并可以进行字幕分享；

s7：通过字幕管理程序可以控制音频采集程序和查看历史字幕和播放对应的音频文件。

技术总结
本发明公开了一种基于跨平台的实时字幕展示方法和管理系统，包括录音模块、语音识别模块、通信模块、设备绑定模块、通信模块、字幕展示模块、字幕分享模块、设备控制模块与文件管理模块，所述录音模块，用于监测终端设备的录音数据；所述语音识别模块，接收录音模块的音频数据，将音频数据通过语音识别技术转化为文本信息；所述通信模块，如果设备在局域网可以接收设备绑定模块发出的绑定广播进行设备绑定；所述设备绑定模块，在局域网中可以发送绑定广播；所述通信模块，可以通过设备绑定模块与音频采集程序中的通信模块建立网络通信连接。优点在于：使用成本很低，极为方便，实时字幕展示的环境也很好搭建。

技术研发人员：冯海洪;毛德平;王行健;许成亮;朱国冉
受保护的技术使用者：安徽咪鼠科技有限公司
技术研发日：2020.01.14
技术公布日：2020.06.05

转载请注明原文地址: https://bbs.8miu.com/read-54329.html

专利

最新回复(0)