国产91免费_国产精品电影一区_日本s色大片在线观看_中文在线免费看视频

您現在的位置: 通信界 >> 視頻通信 >> 技術正文  
 
H.264視頻編碼器在DM6437上的優化實現[圖]
[ 通信界 / 佚名 / www.6611o.com / 2012/7/5 21:25:43 ]
 

摘要:為了實現基于DSP的H.264視頻編碼器的實時性能,提出了一系列優化實現方法。首先結合TMS320DM6437硬件特點,描述了X264代碼向TMS320DM6437平臺的移植過程和優化方法,重點介紹了整數DCT變換和量化的線性匯編編寫及匯編級優化。實驗結果表明,本編碼器實現了cif'格式視頻的實時編碼,Dl格式視頻的編碼速率也達到了18 fps,基本滿足視頻監控系統中編碼器的需求。

H.264作為新一代多媒體視頻編碼標準,采用了許多先進的技術,在編碼效率和性能大幅度提高的同時,增加了抗誤碼及網絡白適應等功能,廣泛地應用于視頻電話、移動視頻和流媒體等場合。傳統上進行音視頻開發一般使用視頻編解碼ASIC芯片的方法,但是這種方法開發周期長、適應性差,而近年出現的高性能DSP(數字信號處理器)就很好的解決了這些問題且產品性能更穩定,所以筆者采用TI公司專門推出的高性能DSP平臺TMS320DM6437(簡稱DM6437)數字媒體處理器來實現H.264視頻編碼器[21。X264是一款支持H.264標準的開源編碼器代碼,是南網上自由組織聯合開發,注重實用,與另外兩種開源代碼JM和T264相比,在不明顯降低圖像質量的基礎上,大大降低了計算復雜度,廣泛應用于視頻壓縮和格式轉換領域,兇此本文選擇開發源代碼X264(20081113版)進行研究。

基于DM6437平臺實現H.264編碼器,需要通過改進算法或者重新進行資源配置,以滿足應用環境的要求。筆者重點研究了H.264編碼器在以TMS320DM6437為日標的CCS平臺上的移植和優化工作,包括C語言級的優化、算法優化、整數DCT變換和量化的線性匯編編寫以及匯編級優化等。

1 H.264視頻編碼器的構建

1.1  X264編碼器到DM6437的移植

X264編碼器支持H.264的基本檔次以及主要檔次的某些功能選項和功能模塊,代碼尺寸非常龐大,視頻編碼速度相當慢。在對X264源碼研究過程中,發現在視頻編碼質量下降不是很明顯的情況下,可以將一些功能模塊刪除,以減小代碼尺寸,加快編碼速度。此項工作在文獻[3-4]中均有詳細講解,讀者可根據實際情況進行調整應用。筆者利用TI公司提供的CCS3.3  (Code Composer Studio)平臺,將裁剪后的X264模型移植到DM6437平臺上。

1.2 視頻采集

DM6437數字媒體處理器中的視頻處理前端(VPFE)具有視頻采集功能,可以將CCD攝像頭采集的RGB圖像轉換為符合BT.656規范的YUV4:2:2圖像。采集完的視頻數據在內存中的數據結構如圖l所示。

在進行H.264視頻編碼時,必須調整原始視頻的數據結構。如果對Dl格式的視頻進行編碼,Y分量數據不變,U分量和V分量數據做垂直方向的2:1亞采樣,轉換成360x288的分辨率;如果對cif'格式的視頻進行編碼,需要對Y分量進行水平和垂直方向的2:1亞采樣,轉換成352x288分辨率,同時對U分量和V分量進行水平方向的2:1亞采樣和垂直方向上的4:1亞采樣,轉換成176x144的分辨率。圖2為經過調整后的Y、U、V各分量的數據結構。

圖l DM6437的VPFE所采集視頻數據的數據結構

圖2調整后視頻數據的數據結構

(注:圖中MxN是Y分量的分辨率,U、V分量的分辨率為( M/2)×( N/2),若為Dl格式,M=720,N=576;若為cif格式,M=352,N=288)1.3 LCD回放DM6437視頻處理子系統中的視頻處理后端(VPBE)負責將符合BT.656規范的YUV4:2:2數據轉換成RGB數據,兇此可以與LCD顯示器進行無縫連接。在攝像頭采集和|L264編碼工作完成以后,本文提出LCD回放模塊,進行重建圖像回放,便于觀察效果。基于DM6437實時視頻采集的H264視頻編碼器系統框圖如圖3所示。

圖3系統框架示意圖2

H.264編碼器在DM6437上的優化剛構建好的基于DM6437的H.264編碼器很慢,難以滿足視頻監控需求,必須對其進行優化,提高處理性能。對H264編碼程序主要從系統優化、算法優化和匯編優化3個方面進行。

2.1系統優化系統優化主要是對ccs提供的各種編譯參數進行選擇、搭配、調整。主要從以下幾個方面進行優化:l)編譯器的優化。首先設定合適的編譯選項,控制編譯器生成更高效、代碼尺寸更小的匯編代碼。文中設計的H.264編碼器所用到的編譯選項包括:-pm,-op2,-03,-mt,-mh,-k等。2)DSP/BIOS的配置.、在DM6437的開發中,CaChe和EDMA等功能的應用已不能單純通過在程序中調用相關API來實現,必須在有DSP/BIOS進行管理的條件下才能正常T作,此時就涉及到存儲空間的合理配置,為了最大化DM6437的存儲性能,本文通過進行多次配置后編碼器T作性能的比較,將LIP配置為32 kB的LIP-Cache.將LID配置為32 kB的LIDCaehe和48kB的LIDSRAM,將L2配置為64 kB的L2Cache和64 kB的L2SRAM。在DM6437中配置Cache過程包括:Ll和L2Cache大小的設置,模式的設置,以及外部存儲器DDR可被高速緩存的設置。3)任務調度。文中設計的H.264視頻編碼器中采集和回放過程的主要操作是數據搬移,可以用EDMA3來實現,進而解放CPU來專心進行編碼T作。兇此設置一個任務即可。

2.2算法優化H.264數字視頻編碼標準,具有很高的壓縮性能,但其運算復雜度是H.263標準的3倍以上,所以需要采用算法來降低運算復雜度。其中比較常用的方法是在幀內/幀間預測過程中采用快速算法,降低模式選擇的次數:或者是對H.264中采用的Lagrangian率失真優化模型進行化簡,提高運算的速度。除上述方法之外,全零塊預判算法也是有效手段之一。

在低碼率視頻應用中,常見的是運動緩慢的具有靜止背景的圖像,靜止背景經過DCT和量化后往往所有系數都為零。被判斷為全零塊的圖像塊可以省去DCT和量化兩個環節而降低運算量、節約運算時間。因此基于H.264編碼器的預判零方案如圖4所示。

圖4  H.264編碼器預判零方案

由于H.264中的幀間模式有16x16、16x8、8x16、8x8、8x4、4x8、4x4 7種模式,所以在運動搜索過程中,零塊的判決閥值也要隨幀間模式的變化而發生變化,不同塊模式(MxN塊)的零塊判決閥值可以定義為:

(1)

其中,M、N=4、8或16,是MxN塊中4x4塊的個數,即為MxN/16。

根據以上的分析,基于最佳零塊判決的運動搜索算法,在進行運動搜索時,加入停止搜索條件,對根據運動矢量計算出來的每個子塊的SAD值進行全零塊判決,這個判決門限由(1)決定,若當前MxN塊的SAD小于門限值,則提前結束對該子塊的運動搜索,并跳過其后的變換和量化操作:否則與常規的運動搜索過程相同。

新的AZBs檢測方法可歸納如下:

1)檢查當前M×N塊的SAD值是否小·THl的值。

如果是真的,判定該M×N塊不是全零塊,否則轉到步驟2);

2)檢查當前M×N塊的SAD值是否小于·THO的值。

如果是真的,判定該M×N塊是全零塊,否則轉到步驟3):

3)執行DCT/Q模塊。

2.3匯編優化文中在CCS3.3中用profile T具對H.264程序進行剖析,結果如表1所示,可發現H.264標準中運動估計、DCT變換、量化等是最耗時的部分。

對這些耗時部分主要采用以下2種方式進行優化:

1)內聯函數(intrinsics)優化  內聯函數是C6000編譯器提供的可以直接映射成為內聯(inline)匯編指令的特殊函數,這樣就可以提高應用程序的性能。由于上述函數都很適合運用數據打包和SIMD(單指令多數據)操作,而6000編譯器提供的內聯函數中有很多相關的函數接口,因此將這些費時函數全部用內聯函數進行改寫,例如要進行4x4塊的量化操作,需要16次循環,要進行16次取數據,16次乘法,16次加法,16次移位操作。dct數組元素寬度為16位,可以利用_memd8()函數一次讀取4個數組元素,這樣可將讀取數據次數減為4次,并在外層循環體內使用其他intrinsics函數一次對兩個DCT數組元素進行處理,從而拆解了內層循環。

2)線性匯編優化  整數DCT變換及量化過程在H.264編碼器代碼中占用了大概20%~25%的時間,對該部分進行匯編級優化,可提高編碼器的性能。整數DCT變換的關鍵函數sub4x4_dct用于計算殘差塊并對殘差塊進行整數DCT變換;add4x4_idct函數是其逆過程,作用是對反量化后的系數進行反DCT變換,并將反變換后的系數矩陣與預測塊矩陣疊加。以sub4x4_dct函數為例,對整數變換的線性匯編級優化過程進行說明。整數變換的公式見(2)式。

為4x4殘差矩陣,即待編碼塊src與pred預測塊的差值,見(3)式。

首先使用兩次LDNW指令從指定存儲器中讀出src和pred中的第一行數據,使src00和src01,src02和src03,pred00和pred01,pred02和pred03分別存放在同一個寄存器中。然后使用兩條SUB2指令進行對應像素的減運算,得到X矩陣的第1行元素。重復以上操作3次就得到整個殘差矩陣。接著使用6次ADD2指令計算,可得,依次類推,可以計算出剩余的3行。最后在這個運算中,使用PACK2和PACKH2指令來對數據進行重新打包,完成數據的交換。

整數DCT4x4蝶形變換過程中,將二維整數變換轉換為兩次一維的變換,先進行水平變換,水平變換后的系數按列存放,垂直變換就轉換成系數矩陣的水平變換。兇此,水平變換和垂直變換可以調用相同的程序來完成。

對量化函數采取匯編優化后,把和MF值用表的形式存儲,要使用這兩個參數時,從表中讀取i_qscale的對應值。整數DCT變換及量化過程優化前后的效率如表2所示。

3  實驗結果文中對經過移植和優化后的H.264編碼器進行實驗驗證,選取具有代表性的視頻序列akiyo(背景簡單,景物運動緩慢)進行編碼,視頻為YUV 4:2:0格式,采用IPPP ……編碼模式,DM6437的時鐘頻率為600 MHz,對于cif'和Dl視頻格式的圖像在不同QP值下測試的結果如表3所示。

(注:平均PSNR的單位為dB.碼率單位為kbit/s,編碼速度單位為fps)對表3進行分析可以看出,在PSNR和碼率沒有引起明顯變化的情況下,H.264編碼器的編碼速度獲得了極大的提高,其中cif格式視頻編碼已經滿足實時性要求,同時Dl格式在QP=36時編碼速度達到了18 fps,這樣的編碼性能基本可以滿足視頻監控系統中的應用。

編碼結束后生成的.264文件存到PC機,可以用VLCplayer進行解碼播放。解碼播放出來的圖像如網5所示。

圖5為用VLC播放cif格式的akiyo視頻文件的截圖,圖(a)表示akiyo視頻原文件截圖,圖(b)表示經過H.264編碼器編碼的akiyo視頻文件截圖,由截圖的畫面質量可以看出,圖像質量沒有明顯下降,整個畫面有不明顯的噪點(臉部).顏色偏暗,證明此H.264編碼器對于cif格式的視頻文件編碼效果較好。

4 結 論

文中首先在DM6437上構建了H.264視頻編碼器,編碼器主要分為攝像頭實時采集、H.264編碼、LCD回放3個部分,組成一個完整的可觀看編碼效率和效果的系統。將X264編碼器移植到DM6437平臺之后,對DM6437硬件資源及性能進行深入研究,分別從C語言級、系統級、算法級、整數DCT變換和量化的線性匯編編寫以及匯編級等方面進行優化,最終實現了cif'格式視頻的實時編碼,基本滿足視頻監控系統中編碼器的需求。本文介紹的針對DM6437平臺的H264編碼器移植、優化的思路和方法,對構建高效的視頻應用平臺具有一定的參考價值。

 

作者:佚名 合作媒體:不詳 編輯:顧北

 

 

 
 熱點技術
普通技術 “5G”,真的來了!牛在哪里?
普通技術 5G,是偽命題嗎?
普通技術 云視頻會議關鍵技術淺析
普通技術 運營商語音能力開放集中管理方案分析
普通技術 5G網絡商用需要“無憂”心
普通技術 面向5G應運而生的邊緣計算
普通技術 簡析5G時代四大關鍵趨勢
普通技術 國家網信辦就《數據安全管理辦法》公開征求意見
普通技術 《車聯網(智能網聯汽車)直連通信使用5905-5925MHz頻段管理規定(
普通技術 中興通訊混合云解決方案,滿足5G多元業務需求
普通技術 大規模MIMO將帶來更多無線信道,但也使無線信道易受攻擊
普通技術 蜂窩車聯網的標準及關鍵技術及網絡架構的研究
普通技術 4G與5G融合組網及互操作技術研究
普通技術 5G中CU-DU架構、設備實現及應用探討
普通技術 無源光網絡承載5G前傳信號可行性的研究概述
普通技術 面向5G中傳和回傳網絡承載解決方案
普通技術 數據中心布線系統可靠性探討
普通技術 家庭互聯網終端價值研究
普通技術 鎏信科技CEO劉舟:從連接層構建IoT云生態,聚焦CMP是關鍵
普通技術 SCEF引入需求分析及部署應用
  版權與免責聲明: ① 凡本網注明“合作媒體:通信界”的所有作品,版權均屬于通信界,未經本網授權不得轉載、摘編或利用其它方式使用。已經本網授權使用作品的,應在授權范圍內使用,并注明“來源:通信界”。違反上述聲明者,本網將追究其相關法律責任。 ② 凡本網注明“合作媒體:XXX(非通信界)”的作品,均轉載自其它媒體,轉載目的在于傳遞更多信息,并不代表本網贊同其觀點和對其真實性負責。 ③ 如因作品內容、版權和其它問題需要同本網聯系的,請在一月內進行。
通信視界
華為余承東:Mate30總體銷量將會超過兩千萬部
趙隨意:媒體融合需積極求變
普通對話 苗圩:建設新一代信息基礎設施 加快制造業數字
普通對話 華為余承東:Mate30總體銷量將會超過兩千萬部
普通對話 趙隨意:媒體融合需積極求變
普通對話 韋樂平:5G給光纖、光模塊、WDM光器件帶來新機
普通對話 安筱鵬:工業互聯網——通向知識分工2.0之路
普通對話 庫克:蘋果不是壟斷者
普通對話 華為何剛:挑戰越大,成就越大
普通對話 華為董事長梁華:盡管遇到外部壓力,5G在商業
普通對話 網易董事局主席丁磊:中國正在引領全球消費趨
普通對話 李彥宏:無人乘用車時代即將到來 智能交通前景
普通對話 中國聯通研究院院長張云勇:雙輪驅動下,工業
普通對話 “段子手”楊元慶:人工智能金句頻出,他能否
普通對話 高通任命克里斯蒂安諾·阿蒙為公司總裁
普通對話 保利威視謝曉昉:深耕視頻技術 助力在線教育
普通對話 九州云副總裁李開:幫助客戶構建自己的云平臺
通信前瞻
楊元慶:中國制造高質量發展的未來是智能制造
對話亞信科技CTO歐陽曄博士:甘為橋梁,攜"電
普通對話 楊元慶:中國制造高質量發展的未來是智能制造
普通對話 對話亞信科技CTO歐陽曄博士:甘為橋梁,攜"電
普通對話 對話倪光南:“中國芯”突圍要發揮綜合優勢
普通對話 黃宇紅:5G給運營商帶來新價值
普通對話 雷軍:小米所有OLED屏幕手機均已支持息屏顯示
普通對話 馬云:我挑戰失敗心服口服,他們才是雙11背后
普通對話 2018年大數據產業發展試點示范項目名單出爐 2
普通對話 陳志剛:提速又降費,中國移動的兩面精彩
普通對話 專訪華為終端何剛:第三代nova已成為爭奪全球
普通對話 中國普天陶雄強:物聯網等新經濟是最大機遇
普通對話 人人車李健:今年發力金融 拓展汽車后市場
普通對話 華為萬飚:三代出貴族,PC產品已走在正確道路
普通對話 共享退潮單車入冬 智享單車卻走向盈利
普通對話 Achronix發布新品單元塊 推動eFPGA升級
普通對話 金柚網COO邱燕:天吳系統2.0真正形成了社保管