音视频技术开发周刊 90期
『音视频技术开发周刊』由LiveVideoStack团队出品,专注在音视频技术领域,纵览相关技术领域的干货和新闻投稿,每周一期。点击『阅读原文』,浏览第90期内容,祝您阅读愉快。
架构
-
刘歧:让人生不留遗憾
时隔两年,LiveVideoStack再次与刘歧相约。这一次,他已经是一家创业公司的技术负责人,负责产品与研发。从技术专家到技术领导者,面临的挑战大相径庭。
-
Hulu:如何实现大型比赛直播系统自动扩容
Hulu 技术团队在过去的一年中,进行了大量系统准备与改进工作,期望提供更稳定,更高质量的大型比赛直播。
-
MPEG工作回顾和展望
本文将简要回顾MPEG已经完成的几项工作,然后介绍MPEG正在做的,以及未来将完成的工作。
传输网络
-
Smooth Delivery:如何减少网络拥塞?
Akamai的Smooth Delivery计划旨在通过两个部分:Pacing+Rate Limiting 增强网络性能,在提高整体网络性能的同时,每个部分都侧重于减少拥塞。
-
熊猫直播P2P分享率优化(下):ASN组网
本文来自熊猫直播基础研发部的投稿,是熊猫直播P2P分享率优化系列文章的第二篇,第一篇请访问这里。本文授权LiveVideoStack发布,重点展示了熊猫直播通过ASN组网提升P2P分享率的实践。
音频/视频技术
-
语音质量评价方法-【音频质量专题】
语音质量评价方法-【音频质量专题】 主要内容: 1.信噪比(Signal-to-NoiseRatio,SNR) 2.分段信噪比(Segment Signal-to-Noise Ratio,SegSNR)...
-
WebRTC代码走读十(视频端到端时延分析)
JitterBuffer实现原理是,在收到网络上的RTP报文后,不直接进行解码,需要缓存一定个数的RTP报文,按照时间戳或者seq的顺序进行重排,消除报文的乱序和抖动问题。
-
WebRTC音频降噪使用
WebRTC的NS原理:把启动前50帧的数据拿来构建噪声模型,把启动前200帧的信号强度用来计算归一化的频谱差值计算。
编解码
-
AV1编码时间下降,接近使用水平
AV1最初发布时,编码速度缓慢,时间过长,严重影响编码器的可用性。随着不断的优化,其编码时间已经有很大改进,几乎可以使用。
-
基于OBS的WebRTC H264编码器
在Windows下,WebRTC使用OpenH264编码H264。 OpenH264是一个软件编码器,它利用cpu进行编码。
-
音视频编码技术基础
本文对音视频编码技术相关的封装格式,视频播放原理,流媒体协议等内容进行了总结。
-
FFmpeg结构与API摘要
本文主要讲述FFmpeg框架结构,通过代码解释各层API的作用和运用。
-
H264码流结构
H264结构中,一个视频图像编码后的数据叫做一帧,一帧由一个片(slice)或多个片组成,一个片由一个或多个宏块(MB)组成,一个宏块由16x16的yuv数据组成。宏块作为H264编码的基本单位。
-
ADPCM音频编解码
所谓ADPCM编码是一种自适应差分脉码调制技术。它可以对音频数据在毫无损失的前提下,将数据量压缩为原来的1/4,这对于音频来说,意义是重大的.
-
MediaCodec API笔记
MediaCodec类可以访问基础的媒体编解码器,即编码器/解码器组件。它是Android基础多媒体支持基础架构的一部分。
AI智能
-
ESRGAN-进击的超分辨率复原
ESRGAN的全名叫Enhanced Super-Resolution Generative Adversarial Networks,发表于ECCV2018,它是基于SRGAN改进而来到。
-
AI新领地—打通图像增强和视觉识别的“任督二脉”
绝大多数深度学习算法只有在高质量的图像上才能取得高性能。实际图像采集过程中,存在各种降质因素,导致图像质量和视觉效果下降,深度学习算法的性能也随之降低。研发和评估新的机器学习算法,增强图像质量的同时,又可以提升物体识别精度,打通图像增强和视觉识别的“任督二脉”,显得尤为重要。
-
清华&美图开源大规模视频分析数据集:含11827条视频,共476个小时 | CVPR 19
清华大学和美图开源了教程类行为视频数据集COIN(COmprehensive INstructional video analysis),内含11827条教程类视频,涉及日常生活12个领域里的180个任务的视频内容。
图像
-
关于HDR,你想知道的全在这
近两年来,市场上涌现了不少各具特色的HDR标准。目前的HDR标准有HDR10、Dolby Vision(杜比视界)、HLG,及HDR10+等四个已经出现在市场上的标准。