跳转至

媒资处理

音视频转码

对视频或音频执行转码,可指定输出媒体的编码格式、帧率、码率、分辨率等参数,以适应终端对不同清晰度和格式的播放需要

支持的格式

类别 功能 说明
输入格式 封装格式 支持所有常见的音视频封装格式,包括:WMV、RM、MOV、MPEG、MP4、3GP、FLV、AVI、RMVB、TS、ASF、MPG、WEBM、MKV、M3U8、WM、ASX、RAM、MPE、VOB、DAT、MP4V、M4V、F4V、MXF、QT、OGG。
视频编码格式 支持所有常见的音视频编码格式,包括:AV1、AVS2、H.263、H.263+、H.264/AVC、H.265/HEVC、H.266/VVC、MPEG-1、MPEG-2、MPEG-4、MJPEG、VP8、VP9、Quicktime、RealVideo、Windows Media Video。
音频编码格式 AAC、ADPCM、AMR、DSD、MP1、MP2、MP3、PCM、RealAudio、Windows Media Audio、VORBIS。
输出格式 封装格式 视频:FLV、MP4、HLS(m3u8+ts)、DASH。
音频:MP3、MP4、OGG、FLAC、M4A。
图片:GIF、WEBP。
视频编码格式 H.264/AVC、H.265/HEVC、H.266/VVC、AV1。
视频高清画质 支持 8K UHD 分辨率,支持转码 HDR 输出。
音频编码格式 MP3、AAC、FLAC、MP2。
音频声道 单声道、双声道、立体环绕声。
其他功能 打水印 图片水印、文字水印、图文混编水印。
拼接片头片尾 为媒体拼上片头或片尾。
剪辑 仅转码出指定时间段的视频,实现剪辑的效果。

适用场景

场景 说明
适配更多终端 将原始媒体转码成拥有更强终端适配能力的格式(如 MP4 和 HLS),使媒体资源能够在更多设备上播放。
适配不同带宽 将视频转换成流畅、标清、高清以及超清等输出,用户可以根据当前网络环境选择合适码率的视频播放。
改善播放效率 转码可以将 MP4 位于尾部的元信息 MOOV 提前到头部,播放器无需下载完整视频即可立即播放。
为视频加水印 为视频加上水印标识视频的归属或版权。
拼接片头片尾与剪辑 在视频的片头或片尾拼接广告、宣传介绍内容等。
节省带宽 采用更先进的编码方式(如 H.266、AV1)转码或转码模式(极速高清),在不损失原始画质的情况下显著降低码率,节省播放带宽。

自适应码流

自适应码流的英文术语是 ABR(Adaptive Bitrate Streaming),特点是包含多个码率的音视频文件。使用自适应码流后,播放器能够根据当前带宽,动态选择最合适的码率播放。云点播支持将视频转成 HLS 和 DASH 等主流的自适应码流格式。

能力 说明
支持的格式 HLS 和 DASH。
起播超低延时 自适应码流包含多种分辨率,播放器通常从低分辨率开始起播,起播速度快。
智能分辨率切换 播放器能够根据当前带宽,动态选择最合适的分辨率播放。
切换过程零卡顿 自适应码流中各个分辨率做到帧对齐,切换过程中零卡顿。
超高画质音效 最高支持 8K UHD 分辨率。支持立体环绕声。支持 HDR 高动态范围成像。
前沿编码技术 支持使用 H.265、H.266、AV1 等先进的编码格式、极速高清编码模式降低视频码率。
支持加密与 DRM 媒体加密、Widevine 和 FairPlay 等 DRM 版权保护方案均依赖于自适应码流。

注意:
自适应码流和转码的区别:
- 自适应码流 URL 包含多个分辨率的输出,转码视频的 URL 只包含一种分辨率的输出。
- 自适应码流播放时,播放器会实时切换当前网络下能流畅播放的最佳分辨率,转码视频播放时不会智能切换。

适用场景

场景 说明
在线教育 学科教育、培训课程等在线场景,视频通常需要加密或 DRM 做版权保护。
视频网站 视频网站有丰富的视频资源,自适应码流能带来更流畅的观看体验。
网络电视 网络电视资源可能有版权保护的诉求,同时观众可能需要根据需求切换更高清的分辨率观看。

画质检测

音画质检测,基于先进的 AI 算法对音视频中的画面帧以及声音质量进行检测并提供整体质量检测评分,涵盖视频画面抖动重影、模糊、低光过曝、花屏、音频异常等多种检测类型。根据检测结果,用户可以快速定位音视频质量问题,有针对性地进行音画质修复和增强,提升音视频质量修复效率。

检测项 说明
视频画面抖动、重影 检测因视频拍摄过程中因相机架设不稳和环境,导致的视频画面出现抖动以及重影等问题。
视频画面模糊 检测因拍摄条件,或视频多次转码或被压缩后产生的模糊问题。
视频画面低光、过曝 检测因环境状况及拍摄摄像头的硬件限制,在某些场景下拍摄的画面亮度和对比度缺失,导致画面较暗或画面过度曝光的问题。
视频画面花屏 检测在拍摄、保存和转存过程中一些未知因素导致视频画面产生花屏问题。
视频画面黑白边 检测在拍摄、保存和转存过程中一些未知因素导致视频画面产生黑边、白边、黑屏、白屏等问题。
视频画面噪点 检测视频拍摄中会因为相机和环境引入随机噪点。
视频画面马赛克 检测出视频画面的马赛克。
视频画面质量评价 用户设定一个视频画面质量分数阈值,经过系统综合评估分析得到视频片段的无参考质量评分,低于该阈值的视频片段结果会反馈给用户。
音频 检测出音频中的静音、低音、爆音等问题。

适用场景

音画质检测适用于 UGC 视频质量检测、老片翻新、4K 生产等业务场景。

场景 说明
UGC UGC 平台(如社交短视频)上传的短视频质量参差不齐,平台可以通过音画质检测能力快速批量检测出视频质量问题,并进行针对性画质修复与增强,提高视频点击率。
平台可以根据视频质量决定推荐曝光率,对于高画质的视频优先推荐,借此也鼓励创作者分享高质量的视频,提升平台视频质量;此外,为提高用户上传视频的质量,平台可以在用户上传视频后进行音画质检测,对于低质量视频,可以禁止或提示视频存在的低质内容,引导鼓励用户重新上传更高质量的视频。
直播平台 对于高价值的直播内容,运营方通常会考虑录制后进行二次剪辑、处理后再次进行类直播分发。通过音画质检测能力,找出质量较差的直播录制素材片段,剔除或进行画质修复与增强,以提高分发的直播录制内容质量,吸引更多关注,以及带来更多收益。
老片翻新 部分老片受限于当时拍摄的技术,可能出现大量的抖动重影、低光过曝、噪点等,画质较差。利用音画质检测的能力,根据检测结果将老片翻新,提升画质,让老片「焕发新生」。

画质重生

音画质重生,利用了先进的音画质修复、音画质增强 AI 算法,提升分辨率的同时,提供视频去噪、轮廓修复、超分辨重建、细节增强、色彩增强、SDR 转 HDR 等功能。

功能 说明
音视频降噪 在视频拍摄中会因相机和环境引入随机噪点,这里提供降噪服务,在保持细节不损失的情况下,消除画面和声音中的随机噪声。
去伪影(毛刺) 视频在转码或多次转码过程中对视频进行了多次压缩,会引入块效应、振铃效应、色度渗透和蚊噪等,去压缩失真能有效修复编码引入的失真。
去划痕 视频在拍摄、保存和转存过程中一些未知因素导致胶片产生划痕和雪花点等破坏,去划痕可以修复视频中的划痕和雪花点等破坏的内容。
细节增强 拍摄相机质量、后期保存和转码过程中导致视频细节不够清晰,细节增强对视频中需要关注的细节进行增强,使画面内容更清晰,内容更丰富。
画质修复 通过 AI 的综合分析能力,自动平衡画面中的纹理内容,在去除压缩伪影和毛刺的同时增强关键细节,从而提高整个画面的总体主观感受。
超分 针对一些视频分辨率较低,提供超分辨率能力对视频细节进行增强修复,利用AI模型达到高分辨率输出的同时有效细节更清晰。
人脸增强 通过人脸检测针对视频中人眼视觉特别关注的人脸部分进行增强,使该区域的细节更加清晰,提高主观感受。
色彩增强 色彩增强使画面更接近真实色彩,并在一定程度上进行增强满足人眼的喜好,解决视频色彩失真或可增强的问题。
低光照增强 暗场景增强能够自动识别场景对画面进行自适应增强,特别在暗场景下能大幅提升暗区的细节和对比度,提升人眼主观质量。
HDR SDR 转 HDR 能力可将普通 SDR 视频转化为 HDR 视频,色深提升至10bit,获得更宽的色域,展现更多色彩细节,以提供更高品质的视频内容。
插帧 通过对原始视频帧间补充新的视频帧,给用户提供更加流畅丝滑的视觉效果,解决低帧率老视频中卡顿、抖动等画质问题。

适用场景

音画质重生适用于 UGC/PGC 视频质量提升、游戏直播录制、老片翻新、低分辨率超分增强等业务场景。

场景 说明
UGC/PGC 通过人脸增强技术,在消除人脸整体的模糊和压缩损伤的同时,进一步对人脸关键的五官重建,对眼睛、嘴巴、耳朵、皮肤甚至发丝都进行了细节重建和纹理添加,显著增加面部细节和质感。
老片翻新 部分老片受限于当时拍摄的技术,可能出现大量的伪影、划痕等,画质较差。利用画质重生的修复和增强能力,将老片翻新,让老片「焕发新生」。
低分辨率超分 受限于拍摄条件、存储成本等因素,有的存档视频以较低分辨率存储,如今需要在较高显示设备播放,如果直接将低分辨率视频转码为高分辨率视频,视频画面会更模糊。通过云点播画质重生超分,结合低画质修复、关键细节增强等 AI 处理,确保超分后视频具有较高的画质。

视频截图

视频截图,是截取视频特定位置的画面,生成图片的功能。云点播支持以下方式的截图:

功能 说明
指定时间点截图 指定一组时间点,截取视频在这些时间点的图像。
采样截图 按相同的时间间隔对视频截取多张图。
截取一张图作封面 指定一个时间点截图,将其作该视频的封面。
截雪碧图 按相同的时间间隔对视频截取多张小图,然后组装成若干大图(即雪碧图),并生成进度条缩略图展示所使用的 VTT 文件。

适用场景

使用截图功能,可以满足如下应用场景:

场景 说明
生成封面 使用视频的某个时间点的截图,作为视频配套的封面。
精彩镜头 对视频中一些精彩镜头进行截图,吸引观看。
人工审核 为了对上传的视频进行审核,可以对视频做采样截图,审核人员根据截图快速判断视频是否合规。
视频摘要 使用雪碧图,生成一个嵌套了多个小图的大图,用来表示一个视频的概要,帮助用户快速了解该视频的内容。
播放进度条预览 雪碧图配合 VTT 文件,用来实现播放器进度条上,看到某个时间点上的预览效果。

复杂合成

复杂合成功能,可以满足高难度的音视频制作场景。使用该功能,在视频轨和音频轨上,以视频、音频、图片作为素材,进行画面旋转、画面叠加、声音混合、音量调节、拼接裁剪、插入转场等复杂操作,生成新的媒体文件。

功能 说明
画面旋转 对视频、图片的画面旋转一定角度,或按照某个方向翻转。
画面叠加 将视频、图片中的画面依序叠加在一起,如实现“画中画”的效果。
画面缩放 将视频、图片按比例缩放,布置在画面的幕布中。
声音控制 升高降低视频、音频中声音的音量,或者对视频静音。
声音混合 将视频、音频中的声音混合在一起(混音)。
声音提取 将视频中的音频提取出来(不保留画面)。
贴图 在视频画面上设置自定义贴图。
裁剪 对视频、音频裁剪出指定时间段。
拼接 对视频、音频、图片按时间顺序前后拼接。
转场 将多段视频或图片拼接时,可以在段落之间添加转场效果。
倍速 将视频或音频素材进行快进或慢放处理。

适用场景

场景 说明
电商售卖 电商售卖商品时,除了图片简介外,通常还需要制作精良的产品介绍视频。
新闻媒体 新闻媒体编写新闻稿的同时,需要结合新闻素材制作新闻视频。
影视剧宣发 影视剧做宣发时,需要制作宣发视频,提升关注度。
慢直播 安防监控、景区摄录等使用摄像头长时间拍摄的场景,对长达数小时的视频快进到1分钟内播放。