音视频技术开发周刊 90期

 

音视频技术开发周刊 90期

 

音视频技术开发周刊』由LiveVideoStack团队出品,专注在音视频技术领域,纵览相关技术领域的干货和新闻投稿,每周一期。点击『阅读原文』,浏览第90期内容,祝您阅读愉快。

 

 

 

架构

 

 

  • 刘歧:让人生不留遗憾

    时隔两年,LiveVideoStack再次与刘歧相约。这一次,他已经是一家创业公司的技术负责人,负责产品与研发。从技术专家到技术领导者,面临的挑战大相径庭。

     

  • Hulu:如何实现大型比赛直播系统自动扩容

    Hulu 技术团队在过去的一年中,进行了大量系统准备与改进工作,期望提供更稳定,更高质量的大型比赛直播。

     

  • MPEG工作回顾和展望

    本文将简要回顾MPEG已经完成的几项工作,然后介绍MPEG正在做的,以及未来将完成的工作。

 

传输网络

 

 

  • Smooth Delivery:如何减少网络拥塞?

    Akamai的Smooth Delivery计划旨在通过两个部分:Pacing+Rate Limiting 增强网络性能,在提高整体网络性能的同时,每个部分都侧重于减少拥塞。

     

  • 熊猫直播P2P分享率优化(下):ASN组网

    本文来自熊猫直播基础研发部的投稿,是熊猫直播P2P分享率优化系列文章的第二篇,第一篇请访问这里。本文授权LiveVideoStack发布,重点展示了熊猫直播通过ASN组网提升P2P分享率的实践。

 

音频/视频技术

 

 

  • 语音质量评价方法-【音频质量专题】

    语音质量评价方法-【音频质量专题】 主要内容: 1.信噪比(Signal-to-NoiseRatio,SNR) 2.分段信噪比(Segment Signal-to-Noise Ratio,SegSNR)...

     

  • WebRTC代码走读十(视频端到端时延分析)

    JitterBuffer实现原理是,在收到网络上的RTP报文后,不直接进行解码,需要缓存一定个数的RTP报文,按照时间戳或者seq的顺序进行重排,消除报文的乱序和抖动问题。

     

  • WebRTC音频降噪使用

    WebRTC的NS原理:把启动前50帧的数据拿来构建噪声模型,把启动前200帧的信号强度用来计算归一化的频谱差值计算。

 

编解码

 

 

 

  • AV1编码时间下降,接近使用水平

    AV1最初发布时,编码速度缓慢,时间过长,严重影响编码器的可用性。随着不断的优化,其编码时间已经有很大改进,几乎可以使用。

     

  • 基于OBS的WebRTC H264编码器

    在Windows下,WebRTC使用OpenH264编码H264。 OpenH264是一个软件编码器,它利用cpu进行编码。

     

  • 音视频编码技术基础

    本文对音视频编码技术相关的封装格式,视频播放原理,流媒体协议等内容进行了总结。

     

  • FFmpeg结构与API摘要

    本文主要讲述FFmpeg框架结构,通过代码解释各层API的作用和运用。

     

  • H264码流结构

    H264结构中,一个视频图像编码后的数据叫做一帧,一帧由一个片(slice)或多个片组成,一个片由一个或多个宏块(MB)组成,一个宏块由16x16的yuv数据组成。宏块作为H264编码的基本单位。

     

  • ADPCM音频编解码

    所谓ADPCM编码是一种自适应差分脉码调制技术。它可以对音频数据在毫无损失的前提下,将数据量压缩为原来的1/4,这对于音频来说,意义是重大的.

     

  • MediaCodec API笔记

    MediaCodec类可以访问基础的媒体编解码器,即编码器/解码器组件。它是Android基础多媒体支持基础架构的一部分。

 

 

AI智能

 

 

 

  • ESRGAN-进击的超分辨率复原

    ESRGAN的全名叫Enhanced Super-Resolution Generative Adversarial Networks,发表于ECCV2018,它是基于SRGAN改进而来到。

     

  • AI新领地—打通图像增强和视觉识别的“任督二脉”

    绝大多数深度学习算法只有在高质量的图像上才能取得高性能。实际图像采集过程中,存在各种降质因素,导致图像质量和视觉效果下降,深度学习算法的性能也随之降低。研发和评估新的机器学习算法,增强图像质量的同时,又可以提升物体识别精度,打通图像增强和视觉识别的“任督二脉”,显得尤为重要。

     

  • 清华&美图开源大规模视频分析数据集:含11827条视频,共476个小时 | CVPR 19

    清华大学和美图开源了教程类行为视频数据集COIN(COmprehensive INstructional video analysis),内含11827条教程类视频,涉及日常生活12个领域里的180个任务的视频内容。

 

 

图像

 

 

  • 关于HDR,你想知道的全在这

    近两年来,市场上涌现了不少各具特色的HDR标准。目前的HDR标准有HDR10、Dolby Vision(杜比视界)、HLG,及HDR10+等四个已经出现在市场上的标准。