功率电感生产厂家
联系我们
热门搜索
点击排行
推荐阅读
猜猜你喜欢的
技术知识 您所在的位置: 首页 > 技术知识

基于 KeyStone DSP 的多核视频处理技术

来源:    作者:    发布时间:2014-12-11 09:40:45    浏览量:

表 1 KeyStone DSP 和视频处理要求(第一部分,共两部分)
多内核视频要求KeyStone 的功能特性能够充分满足要求
外部 I/O 接口 - 压缩的视频以太网接口两个 SGMII 1G端口可支持适用于分包压缩视频的高比特率以太网接口。正如第二部分所述,典型的 HD 视频需要高达 10 Mbps 的速率,以使以太网接口能够支持多个压缩视频通道。此外,KeyStone DSP 还拥有分组加速器硬件子系统,可支持多个 IP 地址且能为每个内核分担分组处理负载。
外部 I/O 接口 - 原始数据接口KeyStone DSP 拥有两个标准的PCI Express通道。假定总线利用率为 60%,每个通道需要承载 5G 字节,这足以传输 YUV 域中 1080i60 的 4 到 5 个通道、D1 的 24 个通道,或 QCIF 30 fps 的超过 300 个通道。此外,KeyStone DSP 还拥有四个 SRIO 通道,其中每个通道可传输 5G 比特,从而使总线利用率为 60% 时,其连接性能是之前的四倍。
外部 I/O 接口 - 语音处理两个电信串行接口端口 (TSIP) 可提供足够的带宽(以每通道 32.768/16.384/8.192 Mbps 的传输速率以及最高 1024 DS0 支持 2/4/8 个通道)来支持与视频应用相关的语音处理。
处理能力首次发布的 KeyStone DSP 拥有 8 个时钟频率为 1.25G 的内核,因而可提供 8G 个周期。8 个功能部件并行工作,每秒可执行 64G 次运算(浮点、定点和数据移动)。此外,这个 KeyStone DSP 的新型 C66x 内核还可支持TI C64x+ DSP 内核的所有指令、TI C67x core 内核的所有指令,以及包含几个支持四则运算和两则运算的 SIMD 指令的其他指令。适用于操作矢量处理类型的理论操作数量是 128G电感器生产厂家 甚或 256G。这些 SIMD 指令可显著提高采用矢量处理的视频处理算法(如运动估算、转换和量化算法等)的效率。
存储器考虑事项 - 片上存储器
每个内核都拥有 32KB 的 L1 数据存储器和 32KB 的 L1 程序存储器。每个都可配置为纯 RAM 或 L1 高速缓存,抑或二者的结合。

每个内核均拥有 512KB 的 L2 专有存储器,其中多达 256KB 可被配置为四通道的 L2 高速缓存。另外,KeyStone DSP 还拥有 4MB 的共享 L2 存储器。
存储器考虑事项 - 外部存储器支持高达 8GB 的 DDR3,模式为 1×16、1×32 和 1×64,高达 1600 MHz 的频率可提供每秒高达 12.8GB 原始比特率。
存储器考虑事项 - 多内核共享存储器控制器2×贴片电感56 比特直接连接至外部存储器接口 (EMIF) DDR。
2×256 比特直接连接至各个 DSP。
适用于程序和数据的多重预取媒体流。
存储器考虑事项 - DMA
10 个传输控制器和 144 个增强型直接存储器接入 (EDMA) 通道使得从外部存储器读写数据具有高效的资源利用率。
内核之间的同步与全局协作全硬件支持 64 个独立阻塞和非阻塞信号标,支持直接和间接请求。
内核之间的紧密与松散链接、数据和消息传输多内核插件电感导航器是一个硬件队列管理器,可控制 8,192 个队列且拥有 6 个可传输消息的渠化 DMA 通道。导航器可支持数据和消息在紧密或松散链接的内核之间进行传递。此外,导航器还能有助于提高数据从多个源传输至多个目的地的高效输出电感器排序。
连接两个芯片的快速总线四通道超链接总线可提供高达每通道 12.5Gbps、总计 50Gbps 的传输速率。

附录A - 解码器性能相关性编码器所采用的工具和算法以及视频内容都会影响解码器的性能。下列因素将影响解码器性能:
&bul电感厂家l; CABAC 或 CAVLC 熵解码器的选择
• 跳帧的数量
• 帧内预测模式的复杂性
• 预测类型—运动估算或帧内预测。(运动补偿需要消耗的解码周期数不同于帧内预测补偿。采用运动补偿还是帧内预测取决于编码器。)
• 不同的运动估算工具(每个宏模块一个运动矢量,每个宏模块 4个运动矢量,或每个宏模块 8 个运动矢量)能改变解码器的复杂度和周期数。
• B 帧宏模块的运动补偿涉及两个参考宏模块,并消耗更多周期。
• 媒体流中的运动量不仅会更改跳过宏模块的数目,同时还会改变解码器的处理要求。
• 比特流在运动矢量、模块值、标记等各个不同值等之间的分配取决于媒体流的内容和编码器算法。不同的分配会相应改变熵解码器的周期数。



附录B — 运动估算和速率控制
运动估算是 H.264 编码中很大一部分内容。H.264 编码器的质量取决于运动估算算法的质量。运动估算所需的周期数取决于运动估算算法的功能特性及特征。以下是几个影响运动估算周期消耗的主要因素:

  • 80V浪涌吸收器原理与设计摘要 针对飞机直流电源上的浪涌干扰,分析了采用电压钳位和开关式稳压电路两种方法,实现80V浪涌吸收器的可行性。经过设计和试验,较好地解决了这一问题。关键词 机载电子设备;80V浪涌吸收器;浪涌干扰随着

  • 新能源汽车数字电源的设计 最近正设计一款新能源汽车车载数字电源;输入电压450V--650V;输出:27.5V110A


    控制芯片TI的F28035;主控:移相全桥+同步整流;载频:100KHZ。请问变压器选TDK EE65的可以吗?


  • 便携式功率分析仪设计-----硬件设计(三)3.3.4.2可变增益放大器由于在信号调理通道上使用了具有较大衰减的无源衰减网络,为动态调整A/D的采样范围,我们在A/D采样模块之前加入一个可变增益放大器,以达到对微小信号或过大信号仍然能够进行采样

  •