在线免费观看成年人视频-在线免费观看国产-在线免费观看国产精品-在线免费观看黄网站-在线免费观看精品

產(chǎn)品分類

當(dāng)前位置: 首頁 > 工業(yè)電子產(chǎn)品 > 集成電路(ICs) > 射頻RF > 通用RF天線

類型分類:
科普知識(shí)
數(shù)據(jù)分類:
通用RF天線

在FPGA上優(yōu)化實(shí)現(xiàn)復(fù)數(shù)浮點(diǎn)計(jì)算

發(fā)布日期:2022-10-17 點(diǎn)擊率:68

高性能浮點(diǎn)處理一直與高性能CPU相關(guān)聯(lián)。在過去幾年中,GPU也成為功能強(qiáng)大的浮點(diǎn)處理平臺(tái),超越了圖形,稱為GP-GPU(通用圖形處理單 元)。新創(chuàng)新是在苛刻的應(yīng)用中實(shí)現(xiàn)基于FPGA的浮點(diǎn)處理。本文的重點(diǎn)是FPGA及其浮點(diǎn)性能和設(shè)計(jì)流程,以及OpenCL的使用,這是高性能浮點(diǎn)計(jì)算前沿的編程語言。

各種處理平臺(tái)的GFLOP指標(biāo)在不斷提高,現(xiàn)在,TFLOP/s這一術(shù)語已經(jīng)使用的非常廣泛了。但是,在某些平臺(tái)上,峰值GFLOP/s, 即,TFLOP/s表示的器件性能信息有限。它只表示了每秒能夠完成的理論浮點(diǎn)加法或者乘法總數(shù)。分析表明,F(xiàn)PGA單精度浮點(diǎn)處理能夠超過1 TFLOP/s。

一種不太復(fù)雜的常用算法是FFT。使用單精度浮點(diǎn)實(shí)現(xiàn)了4096點(diǎn)FFT。它能夠在每個(gè)時(shí)鐘周期輸入輸出四個(gè)復(fù)數(shù)采樣。每一個(gè)FFT內(nèi)核運(yùn)行速度超過80 GFLOP/s,大容量FPGA的資源支持實(shí)現(xiàn)7個(gè)這類的內(nèi)核。

但是,如圖1所示,這一FPGA的FFT算法GFLOP/s接近400 GFLOP/s。這是“按鍵式”O(jiān)penCL編譯結(jié)果,不需要FPGA專業(yè)知識(shí)。使用邏輯鎖定和DSE進(jìn)行優(yōu)化,7內(nèi)核設(shè)計(jì)接近單內(nèi)核設(shè)計(jì)的Fmax,將 其GFLOP/s提升至500,超過了10 GFLOP/s每瓦。

這一每瓦GFLOP/s要比CPU或者GPU功效高很多。對(duì)比一下GPU,GPU在這些FFT長度上效率并不高,因此,沒有進(jìn)行基準(zhǔn)測(cè)試。當(dāng)FFT長度達(dá)到幾十萬個(gè)點(diǎn)時(shí),GPU效率才比較高,能夠?yàn)镃PU提供有效的加速功能。

1

圖1:Altera Stratix V 5SGSD8 FPGA浮點(diǎn)FFT性能。

 

總之,實(shí)際的GFLOP/s一般只達(dá)到峰值或者理論GFLOP/s的一小部分。出于這一原因,更好的方法是采用算法來對(duì)比性能,這種算法能夠合理的表示典型應(yīng)用的特性。算法越復(fù)雜,典型實(shí)際應(yīng)用的基準(zhǔn)測(cè)試就越具有代表性。

并不是依靠供應(yīng)商的峰值GFLOP/s指標(biāo)來確定處理技術(shù),而是使用比較復(fù)雜具有代表性的第三方評(píng)估。高性能計(jì)算理想的算法是Cholesky分解。

這一算法經(jīng)常用于線性代數(shù),高效的解出多個(gè)方程,可以實(shí)現(xiàn)矩陣求逆功能。這一算法非常復(fù)雜,要獲得合理的結(jié)果總是要求浮點(diǎn)數(shù)值表示。計(jì)算需求與N3成正比,N是矩陣維度,因此,一般對(duì)處理要求很高。實(shí)際GFLOP/s取決于矩陣大小以及所要求的矩陣處理吞吐量。

表1顯示了基于Nvidia GPU指標(biāo)1.35TFLOP/s的基準(zhǔn)測(cè)試結(jié)果,使用了各種庫,以及Xilinx Virtex6 XC6VSX475T,其密度達(dá)到475K LC,這種FPGA針對(duì)DSP處理進(jìn)行了優(yōu)化。用于Cholesky基準(zhǔn)測(cè)試時(shí),這些器件在密度上與Altera FPGA相似。

2

表1:田納西州大學(xué)的GPU和Xilinx FPGA Cholesky基準(zhǔn)測(cè)試。

 

LAPACK和MAGMA是商用庫,而GPU GFLOP/s是指采用田納西州大學(xué)開發(fā)的OpenCL實(shí)現(xiàn)的。對(duì)于小規(guī)模矩陣,后者更優(yōu)化一些。

中等規(guī)模的Altera Stratix V FPGA (460kLE)也進(jìn)行了基準(zhǔn)測(cè)試,使用了單精度浮點(diǎn)Cholesky算法。如表2所示,在Stratix V FPGA上進(jìn)行Cholesky算法的性能要比Xilinx結(jié)果高很多。

3

表2:BDTI的Altera FPGA Cholesky和QR基準(zhǔn)測(cè)試。

應(yīng)指出,矩陣大小并不相同。田納西州大學(xué)結(jié)果是從[512×512]矩陣大小開始的。BDTI基準(zhǔn)測(cè)試達(dá)到了[360×360]矩陣大小。原因是,矩 陣規(guī)模較小時(shí),GPU效率非常低,因此,在這些應(yīng)用中,不應(yīng)該使用它們來加速CPU。在規(guī)模較小的矩陣時(shí),F(xiàn)PGA的工作效率非常高。

其次,BDTI基準(zhǔn)測(cè)試是基于每個(gè)Cholesky內(nèi)核的。每個(gè)可參數(shù)賦值的Cholesky內(nèi)核支持選擇矩陣大小,矢量大小和通道數(shù)量。矢量大小大 致決定了FPGA資源。較大的[360×360]矩陣使用了較長的矢量,支持這一FPGA中實(shí)現(xiàn)一個(gè)內(nèi)核,達(dá)到91GFLOP/s。較小的[60×60] 矩陣使用的資源更少,因此,可以實(shí)現(xiàn)兩個(gè)內(nèi)核,總共是2×39=78GFLOP/s。最小的[30×30]矩陣支持實(shí)現(xiàn)三個(gè)內(nèi)核,總共是 3×26=78GFLOP/s。

FPGA看起來更適合解決數(shù)據(jù)規(guī)模較小的問題。原因之一是因?yàn)橛?jì)算負(fù)載隨N3而增大,數(shù)據(jù)I/O隨N2增大,最終,隨著數(shù)據(jù)的增加,GPU的I/O瓶 頸不再是問題。另一項(xiàng)考慮是吞吐量。隨著矩陣規(guī)模的增大,由于每個(gè)矩陣的處理量增大,矩陣每秒吞吐量會(huì)大幅度下降。在某些點(diǎn),吞吐量變得非常低,以至于無 法滿足很多應(yīng)用的要求。在很多情況下,會(huì)分解大規(guī)模矩陣,處理每個(gè)小的子矩陣,以解決由于龐大的處理負(fù)載造成的吞吐量限制問題。

對(duì)于FFT,計(jì)算負(fù)載增加N log2 N,而數(shù)據(jù)I/O隨N增大而增大。對(duì)于規(guī)模較大的數(shù)據(jù),GPU是高效的計(jì)算引擎。作為對(duì)比,數(shù)據(jù)長度很短時(shí),F(xiàn)PGA是高效的計(jì)算引擎,更適合FFT長度達(dá)到數(shù)千的很多應(yīng)用,對(duì)于GPU,F(xiàn)FT長度是數(shù)十萬。

GPU和FPGA設(shè)計(jì)方法

使用Nvidia的專用CUDA語言或者開放標(biāo)準(zhǔn)OpenCL語言對(duì)GPU進(jìn)行編程。這些語言在能力上非常相似,而最大的不同在于CUDA只能用在Nvidia GPU上。

FPGA通常使用HDL語言Verilog或者VHDL進(jìn)行編程。這些語言的最新版雖然采用了浮點(diǎn)數(shù)定義,不用進(jìn)行綜合,但都不太適合支持浮點(diǎn)設(shè)計(jì)。例如,在System Verilog中,短實(shí)數(shù)變量與IEEE單精度(浮點(diǎn))對(duì)應(yīng),實(shí)數(shù)變量與IEEE雙精度對(duì)應(yīng)。

使用傳統(tǒng)的方法,將浮點(diǎn)數(shù)據(jù)通路綜合到FPGA的效率非常低。Xilinx FPGA在Cholesky算法上的性能很低,它使用了Xilinx浮點(diǎn)內(nèi)核生成功能,這證實(shí)了這一點(diǎn)。而Altera采用了兩種不同的方法。第一種使用 基于Mathworks的設(shè)計(jì)輸入,稱之為DSP Builder高級(jí)模塊庫。這一工具包含了對(duì)定點(diǎn)和浮點(diǎn)數(shù)的支持。它支持7種不同精度的浮點(diǎn),包括IEEE半精度、單精度和雙精度。它還支持矢量化,這是 高效實(shí)現(xiàn)線性代數(shù)所需要的。而最重要的是,它能夠?qū)⒏↑c(diǎn)電路高效的映射到目前的定點(diǎn)FPGA體系結(jié)構(gòu)中,如基準(zhǔn)測(cè)試所示,規(guī)模中等的28 nm FPGA,Cholesky算法接近了100GFLOP/s。作為對(duì)比,在不具有綜合能力的規(guī)模相似的Xilinx FPGA上,實(shí)現(xiàn)同樣的算法,使用密度相似的FPGA,性能只有20GFLOP/s。

GPU編程人員比較熟悉OpenCL。面向FPGA的OpenCL編譯意味著,面向AMD或者Nvidia GPU編寫的OpenCL代碼可以編譯到FPGA中。Altera的OpenCL編譯器支持GPU程序使用FPGA,不需要熟練的開發(fā)典型的FPGA設(shè)計(jì)。

使用支持FPGA的OpenCL,相對(duì)于GPU有幾個(gè)關(guān)鍵優(yōu)勢(shì)。首先,GPU的I/O是有限制的。所有輸入和輸出數(shù)據(jù)必須由主CPU通過PCI接口進(jìn)行傳輸。結(jié)果延時(shí)會(huì)讓GPU處理引擎暫停,因此,降低了性能。

FPGA以各種寬帶I/O功能而知名。這些功能支持?jǐn)?shù)據(jù)通過千兆以太網(wǎng)和SRIO,或者直接從ADC和DAC輸入輸出FPGA。Altera定義了OpenCL標(biāo)準(zhǔn)的供應(yīng)商專用擴(kuò)展,以支持流操作。

即使與I/O瓶頸無關(guān),F(xiàn)PGA的處理延時(shí)也要比GPU低很多。眾所周知,GPU必須有數(shù)千個(gè)線程才能高效的工作。這是由于存儲(chǔ)器讀取很長的延時(shí),以 及GPU大量的處理內(nèi)核之間的延時(shí)。實(shí)際上,GPU必須有很多任務(wù)才能使得處理內(nèi)核不會(huì)暫停等待數(shù)據(jù),否則會(huì)導(dǎo)致任務(wù)很長的延時(shí)。

而FPGA使用了“粗粒度并行”體系結(jié)構(gòu)。它建立了多個(gè)經(jīng)過優(yōu)化的并行數(shù)據(jù)通路,每一通路一般在每個(gè)時(shí)鐘周期輸出一個(gè)結(jié)果。數(shù)據(jù)通路的例化數(shù)取決于 FPGA資源,但一般要比GPU內(nèi)核數(shù)少很多。但是,每一數(shù)據(jù)通路例化的吞吐量要比GPU內(nèi)核高得多。這一方法的主要優(yōu)勢(shì)是低延時(shí)。降低延時(shí)在很多應(yīng)用中 都是關(guān)鍵的性能優(yōu)勢(shì)。

FPGA的另一優(yōu)勢(shì)是很低的功耗,極大的降低了每瓦GFLOP/s。正如BDTI所測(cè)量的,Cholesky等復(fù)數(shù)浮點(diǎn)算法的每瓦GFLOP/s是每 瓦5~6GFLOP/s。一般很難進(jìn)行GPU能效測(cè)量,但是,Cholesky的GPU性能達(dá)到50GFLOP/s,典型功耗是200W,得到的結(jié)果是 0.25每瓦GFLOP/s,單位FLOP/s的功率高20倍。

OpenCL和DSP Builder都依靠“融合數(shù)據(jù)通路”這種技術(shù)(圖2),以這種技術(shù)實(shí)現(xiàn)浮點(diǎn)處理,能夠大幅度減少桶形移位電路,從而支持使用FPGA來開發(fā)大規(guī)模高性能浮點(diǎn)設(shè)計(jì)。

4

  圖2:浮點(diǎn)的融合數(shù)據(jù)通路實(shí)現(xiàn)。

為降低桶形移位頻率,綜合過程盡可能使用較大的尾數(shù)寬度,從而不需要頻率歸一化和去歸一化。27×27和36×36硬核乘法器支持比單精度實(shí)現(xiàn)所要求 的23位更大的乘法計(jì)算,54×54和72×72結(jié)構(gòu)的乘法器支持比52位更大的計(jì)算,這通常是雙精度實(shí)現(xiàn)所要求的。FPGA邏輯已經(jīng)針對(duì)大規(guī)模定點(diǎn)加法 器電路進(jìn)行了優(yōu)化,包括了內(nèi)置進(jìn)位超前電路。

當(dāng)需要進(jìn)行歸一化和去歸一化時(shí),另一種可以避免低性能和過度布線的方法是使用乘法器。對(duì)于一個(gè)24位單精度尾數(shù)(包括符號(hào)位),24×24乘法器通過乘以2n對(duì)輸入移位。27×27和36×36硬核乘法器支持單精度擴(kuò)展尾數(shù),可以用于構(gòu)建雙精度乘法器。

在很多線性代數(shù)算法中,矢量點(diǎn)乘(圖3)是占用大量FLOP/s的底層運(yùn)算。單精度實(shí)現(xiàn)長度是64的長矢量點(diǎn)乘需要64個(gè)浮點(diǎn)乘法器,以及隨后由63個(gè)浮點(diǎn)加法器構(gòu)成的加法樹。這類實(shí)現(xiàn)需要很多桶形移位電路。

5

  圖3:矢量點(diǎn)乘優(yōu)化。

相反,可以對(duì)64個(gè)乘法器的輸出進(jìn)行去歸一化,成為公共指數(shù),最大是64位指數(shù)。可以使用定點(diǎn)加法器電路對(duì)這些64路輸出求和,在加法樹的最后進(jìn)行最 終的歸一化。如圖3所示,這一本地模塊浮點(diǎn)處理過程省掉了每一加法器所需要的臨時(shí)歸一化和去歸一化。即使是IEEE754浮點(diǎn),最大指數(shù)基本決定了最終的 指數(shù),因此,這種改變只是在計(jì)算早期進(jìn)行指數(shù)調(diào)整。

但是,進(jìn)行信號(hào)處理時(shí),在計(jì)算最后盡可能以高精度來截?cái)嘟Y(jié)果才能獲得最佳結(jié)果。這種方法進(jìn)位額外的尾數(shù),補(bǔ)償了單精度浮點(diǎn)處理所需要的早期去歸一化次優(yōu)方法,一般從27位到36位。采用浮點(diǎn)乘法器進(jìn)行尾數(shù)擴(kuò)展,因此,在每一步不需要對(duì)乘積進(jìn)行歸一化。

注意,這一方法每個(gè)時(shí)鐘周期也會(huì)產(chǎn)生一個(gè)結(jié)果。GPU體系結(jié)構(gòu)可以并行產(chǎn)生所有浮點(diǎn)乘法,但是不能高效的并行進(jìn)行加法。之所以這樣是因?yàn)椴煌膬?nèi)核必須通過本地存儲(chǔ)器傳輸數(shù)據(jù),彼此實(shí)現(xiàn)通信,因此,不能靈活的連接FPGA體系結(jié)構(gòu)。

這一方法產(chǎn)生的結(jié)果要比傳統(tǒng)IEEE754浮點(diǎn)結(jié)果精確得多,如表3的測(cè)量結(jié)果所示。BDTI的基準(zhǔn)測(cè)試獲得了相似的結(jié)果。

6

  表3:FPGA相對(duì)于IEEE754浮點(diǎn)更精確的結(jié)果。

使用Cholesky分解算法,實(shí)現(xiàn)大規(guī)模矩陣求逆,獲得了表3的結(jié)果。以三種不同的方法實(shí)現(xiàn)了相同的算法——在Matlab/Simulink中, 使用了IEEE754單精度浮點(diǎn),在RTL單精度浮點(diǎn)處理中,使用融合數(shù)據(jù)通路方法,在Matlab中也使用了雙精度浮點(diǎn)。雙精度實(shí)現(xiàn)要比單精度實(shí)現(xiàn)精度 高十億倍(109)。

表3對(duì)比了Matlab單精度;RTL單精度和Matlab雙精度存在誤差,確認(rèn)了融合數(shù)據(jù)通路方法的完整性。采用了這一方法來獲得輸出矩陣中所有復(fù)數(shù)元素的歸一化誤差以及矩陣元素的最大誤差。使用Frobenius范數(shù)計(jì)算了總誤差和范數(shù):

7

請(qǐng)注意,由于范數(shù)包括了所有元素的誤差,因此,它要比每一誤差大很多。

而且,DSP Builder高級(jí)模塊庫和OpenCL工具流程都針對(duì)下一代FPGA體系結(jié)構(gòu),支持并優(yōu)化目前的設(shè)計(jì)。由于體系結(jié)構(gòu)創(chuàng)新和工藝技術(shù)創(chuàng)新,性能可以達(dá)到100峰值GFLOPs/W。

總結(jié)

高性能計(jì)算應(yīng)用現(xiàn)在有新的處理平臺(tái)選擇。對(duì)于特殊類型的浮點(diǎn)算法,F(xiàn)PGA能夠提供低延時(shí)和較高的GFLOP/s。在幾乎所有應(yīng)用中,F(xiàn)PGA都能夠?qū)崿F(xiàn)優(yōu)異的每瓦GFLOP/s。隨著下一代高性能計(jì)算優(yōu)化FPGA的推出,這種優(yōu)勢(shì)會(huì)更明顯。

Altera的OpenCL編譯器為GPU編程人員提供了幾乎無縫的方法來評(píng)估這一新處理體系結(jié)構(gòu)的指標(biāo)。Altera OpenCL符合1.2規(guī)范,提供全面的數(shù)據(jù)庫支持。它解決了傳統(tǒng)FPGA遇到的時(shí)序收斂、DDR存儲(chǔ)器管理以及PCIe主處理器接口等難題。

對(duì)于非GPU開發(fā)人員,Altera提供DSP Builder高級(jí)模塊庫工具流程,支持開發(fā)人員開發(fā)高Fmax定點(diǎn)或者浮點(diǎn)DSP設(shè)計(jì),同時(shí)保持了基于Mathworks的仿真和開發(fā)環(huán)境的優(yōu)點(diǎn)。要求 高效能工作流程的FPGA開發(fā)人員多年以來一直使用這一產(chǎn)品,與經(jīng)驗(yàn)豐富的FPGA開發(fā)人員相比,所實(shí)現(xiàn)的Fmax性能相同。

下一篇: PLC、DCS、FCS三大控

上一篇: 直流PTC熱敏電阻恒溫

人妻少妇粗大持久满足| 人妻另类 专区 欧美 制服| 欧美最猛黑人XXXⅩ猛男欧| 日韩精品无码观看视频免费| 无码人妻丰满熟妇奶水区码| 亚洲日韩AV无码一区二区三区人| 中文字幕无线码免费人妻| 被老头侵犯的人妻| 国产男男GaYGaY无套| 久久狼人大香伊蕉国产| 人妻另类 专区 欧美 制服| 无码人妻精品一区二区蜜桃不卡| 亚洲日韩看片成人无码| Y1111111少妇影院| 国产男男GayGay裸交视频| 狼人无码精华AV午夜精品| 日韩av在线一区二区| 亚洲AV无码精品色午夜果冻不卡 | 亚洲人成网站精品片在线观看 | 免费无码又爽又刺激高潮软件| 日本丰满熟妇人妻aqq| 亚洲А∨天堂男人色无码| 99久久婷婷国产综合亚洲| 国产VIVODESHD精品| 久久精品国产亚洲AV香蕉| 日本爆乳片手机在线播放| 亚洲AV无码乱码精品观看| 99久久精品国产综合| 国产精品无码无卡在线观看久| 久久综合精品国产二区无码| 日韩码一码二码三码区别| 亚洲欧美一区二区成人片牛牛 | 一区二区三区四区黄色网站| 成人免费视频一区二区三区| 久久AV无码专区亚洲AV桃花岛| 日本少妇情视频WWW| 亚洲精品蜜桃久久久久久| 苍井空浴缸大战猛男120分钟 | 国产精品∧V在线观看| 旅游途中夫妻换着玩的说说搞笑| 丝袜灬啊灬快灬高潮了视频 | 老汉吸奶水捏奶头小说| 特区爱奴在线观看| 中文在线っと好きだった最新版 | 久久久久高潮毛片免费全部播放| 日产乱码一二三区别免费| 亚洲伊人久久大香线蕉AV| 国产AV无码日韩AV无码网站| 妹妹中考前让我C了1次| 亚洲 欧美精品SUV| 被两个男人按住吃奶好爽| 久久国产精品99国产精| 水蜜桃国产成人精品网站| 2021最新国产在线人成| 黑人异族巨大巨大巨粗| 日日摸日日碰夜夜爽无码| 在线观看亚洲AV日韩A∨| 麻豆AV一区二区三区| 免费体验120秒视频| 娇喘潮喷抽搐高潮在线视频 | 日韩人妻潮喷中文在线视频| 野花影视大全在线观看免费高清| 国产成人亚洲欧美二区综合| 欧美成人午夜视频| 亚洲欧美日韩国产精品一区| 方辰苏婉儿是哪本小说的主角| 久久综合亚洲色1080P| 小雪尝禁果又粗又大的中国地图| 班长哭了能不能再抠游戏里面的钱 | 老师黑色丝袜被躁翻了AV| 小浪蹄子蜜水噗呲噗呲的| 成人无码区免费A∨直播| 免费无码观看的AV在线播放| 亚洲国产成人综合在线不卡| 国产成人AV一区二区三区| 欧美激情XXXX| 一二三四在线看日本高清| 国产又色又爽又黄的网站在线| 日本畜禽CORPORATION| 中文中文字幕成人无码AⅤ| 激情爆乳一区二区三区| 无码成人H动漫在线网站| 被驯服的人妻佐佐木明希| 免费看美女被靠到爽的视频| 亚洲欧美日本中文字不卡| 国产清纯白嫩初高生在线观看| 色偷偷偷久久伊人大杳蕉| GAY欧美猛男巨大FUCKIN| 榴莲草莓视频黄丝瓜芭乐秋葵| 亚洲AV成人一区二区三区不卡| 国产AV寂寞骚妇| 日本特黄特色AAA大片免费| AV人摸人人人澡人人超碰手机版 | 久久久久亚洲AV无码麻豆| 亚洲AV无码蜜臀久久寂寞少妇| 国产经典一区二区三区蜜芽| 日韩人妻一区二区三区蜜桃视频| A级国产乱理伦片在线播放| 毛片A级毛片免费观看品善网| 亚洲人成亚洲精品| 精品久久久久久综合日本| 亚洲AV无码日韩AⅤ无码忘忧草| 国产精品久久久久久超碰| 四虎影视成人永久免费观看视频| 成人无码区免费AⅤ片| 日本19禁啪啪无遮挡免费| A级国产乱理伦片在线播放| 欧美xxxxx视频| 999久久久免费精品播放| 免费A级毛片中文字幕| 夜夜爽夜夜叫夜夜高潮漏水| 久久精品国产精品国产精品污 | 69久久夜色精品国产69| 免费无码的AV片在线观看| 中文天堂在线WWW最新版官网| 看全色黄大色黄大片 视频| 亚洲色欲色欲WWW成人网| 精品系列无码一区二区三区| 亚洲国产精品悠悠久久琪琪| 叫吧宝贝我想听你叫什么| 亚洲成人免费av| 精品国际久久久久999波多野| 亚洲国产精品无码久久久动漫| 孩子玩着玩着就进去了怎么回事| 亚洲AV毛片一区二区三区| 国语自产偷拍精品视频偷| 亚洲精品成人区在线观看| 精品无人区一线二线三线区别| 亚洲日本一本DVD高清| 久久久久亚洲AV无码专区首JN| 亚洲中文字幕无码超碰| 看AV免费毛片手机播放| 中文字幕亚洲人妻| 欧美成人AⅤ高清免费观看| JAVAPARSER乱偷| 日本少妇高潮喷水XXXXXXX| 丰满少妇高潮惨叫久久久| 无码8090精品久久一区| 国产亚洲精品A在线观看APP| 亚洲精品无码久久久久不卡| 久久久久人妻一区精品性色AV| 尤物在线视频.YW163.成年| 免费萌白酱国产一区二区三区| AV无码一区二区大桥久未| 日产精品卡二卡三卡四卡区| 国产A级毛片久久久精品毛片| 午夜天堂AV天堂久久久| 妓女爽爽爽爽爽妓女8888| 一级特黄无码毛片av一区二区| 免费无码又爽又刺激软件下载直播| CHINA 农村妇女NOMEX| 三妻四妾免费观看完整版高清| 国产精品久久国产三级国| 亚洲国产成人精品无码一区二区| 久久久无码人妻精品无码| AVTT天堂网久久精品| 色综合色综合久久综合频道88| 国产无套内射又大又猛又粗又爽| 亚洲精品无码永久电影在线| 美国ZOOM动物| 成 人 H动 漫在线播放日本| 污到你下面流水的小黄文| 娇妻借好友1—38| 中文字幕日本人妻久久久免费| 漂亮人妻洗澡被公强BD| 国产成人精品午夜视频| 亚洲国产成人五月综合网 | CAOPORN国产精品免费| 少女たちよ在线观看动漫4集免费| 国产一区二区三区精品视频| 一区二区三区在线 | 网站| 人妻精品久久一区二区av| 国产精品福利一区二区| 亚洲色成人网一二三区| 欧美黑人猛XXxXX内射| 国产成人乱色伦区小说| 亚洲熟妇无码八V在线播放| 欧美一区二区三区放荡人妇 | 大屁股熟女一区二区三区| 亚洲AV无码丰满尖叫高潮| 免费又黄又爽又猛的毛片| 国产成人无码免费视频79| 亚洲愉拍99热成人精品热久久| 人妻人人做人碰人人添| 国产亚洲欧美日韩俺去了| 中文字幕夫の上司に犯新沢平兰 | 女人为啥摸几下就让进了| 国产成人亚洲综合| 影音先锋每日AV色资源站| 三级做A全过程在线观看| 精品无码人妻一区二区三区品| SHOPIFY日本站5ZAWW| 亚洲AV无码一区二区二三区我| 女人高潮被爽到呻吟在线观看| 国产乱码卡二卡三卡43| 2023国精产品一二三四区| 西西人体444WWW高清大胆| 欧美VPSWINDOWS精品| 国产在线拍揄自揄拍无码| JAVAPARSER乱偷|