综合亚洲自拍_...av二区三区久久精品_日本暖暖在线视频_强乱中文字幕av一区乱码_精品一区二区三区毛片_www.日韩免费_97国产精品videossex_中文字幕一区二区三区日韩精品_精品国产精品国产精品_91黄色8090

您的位置:首頁 > 股票 > 正文

只有 GPT-4 可以自我改進,GPT-3.5 都不行,MIT& 微軟代碼生成實驗新發現

2023-07-05 11:41:11 來源:ZAKER科技

機器之心報道

編輯:趙陽


(資料圖片)

作為最領先的大模型,GPT-4 有自我糾正生成代碼的能力,結合人類反饋,自我糾正能力還能進一步的提高。

大型語言模型(LLM)已被證明能夠從自然語言中生成代碼片段,但在應對復雜的編碼挑戰,如專業競賽和軟件工程專業面試時,仍面臨巨大的挑戰。最近的研究試圖通過利用自修復來提高模型編碼性能。自修復是指讓模型反思并糾正自己代碼中的錯誤。

下圖 1 顯示了基于自修復方法的典型工作流程。首先,給定一個規范,從代碼生成模型中對程序進行采樣;然后在作為一部分規范提供的一套單元測試上執行程序;如果程序在任一單元測試中失敗,則將錯誤消息和錯誤程序提供給一個反饋生成模型,該模型輸出代碼失敗原因的簡短解釋;最后,反饋被傳遞給修復模型,該模型生成程序的最終固化版本。

從表面上看,這是一個非常有吸引力的想法。這種設計能讓系統克服在解碼過程中由離群樣本引起的錯誤;在修復階段,可以輕松地整合來自編譯器、靜態分析工具和執行引擎等符號系統的反饋,并模仿人類軟件工程師編寫代碼的試錯方式。

然而,自修復需要更多的模型調用,計算成本較高。特別要注意的是,自修復能否奏效,最終歸結為在同等計算性能預算下,是否能從模型中抽取更多代碼樣本,并將其與作為一部分任務提供的單元測試套件進行比較。

至關重要的是,自修復的有效性不僅取決于模型生成代碼的能力(文獻中對此進行了廣泛研究),還取決于它識別代碼(由模型本身生成)在任務規范方面是如何出錯的能力。此前沒有任何工作試圖詳細研究這些能力的影響。

本文中,來自 MIT、微軟研究院的研究者在解決競賽級別的代碼生成任務時,使用 GPT-3.5 和 GPT-4 研究自修復的有效性。研究者首先提出一種新的評估策略,稱為 pass@t,其中獲得正確程序的可能性(相對于給定的單元測試)相對于從模型中采樣的 token 總數進行加權。

使用新的評估策略代替傳統的 pass@k 度量(根據試驗次數衡量通過率),研究者能夠準確地將通過自修復獲得的性能與模型在生成反饋和進行修復時所做的任何額外工作進行比較。研究者仔細探究了在一系列超參數下的動態自修復過程。

最后,鑒于研究的主要目標是深入了解最先進的代碼生成模型反思和調試自己代碼的能力,本文進行了一組實驗,單獨研究了改進反饋階段的影響。通過分析使用比代碼生成模型更強的反饋生成模型(使用 GPT-4 為 GPT-3.5 代碼模型生成反饋)的影響,研究者進行了一項研究:讓人類對不正確的程序提供反饋,以便將模型生成的自反饋與人類提供的自反饋進行比較。

論文地址:https://arxiv.org/pdf/2306.09896.pdf

從本文的實驗中,研究者有了以下發現:

1. 當考慮進行檢查和修復的成本時,自修復的性能收益只能用 GPT-4 來衡量;對于 GPT-3.5,在所有配置下,修復的通過率低于或等于基線模型 / 無修復方法的通過率。

2. 即使對于 GPT-4,性能提升也是適度的(66% → 71% 的通過率,預算為 7000 個 token,約 45 個獨立同分布(i.i.d.)的 GPT-4 樣本),并同時取決于初始程序是否具有足夠的多樣性。

3. 用 GPT-4 產生的反饋代替 GPT-3.5 對錯誤的解釋,可以獲得更好的自修復性能,甚至超過了基線的無修復 GPT-3.5 方法(50% → 7000token 時為 54%)。

4. 用人類的解釋取代 GPT-4 自己的解釋可以顯著改善修復結果,從而使通過測試的修復程序數量增加 57%。

愛丁堡大學博士生符堯表示:「只有 GPT-4 可以自我改進,而較弱的模型不能,這一發現非常有趣,表明(大模型存在)一種新型的涌現能力(即改進自然語言反饋),可能只有在模型足夠成熟(大而整齊)時才存在。大模型的這種能力在論文《Improving Language Model Negotiation with Self-Play and In-Context Learning from AI Feedback》中也存在過。

只有足夠成熟的模型才能清楚(listen to)并改進自然語言反饋,較弱的模型要么無法理解反饋,要么無法對其進行改進。

我傾向于相信這種涌現能力(通過語言反饋進行自我改進)會對 LLM 研究產生非常重要的影響,因為這意味著 AI 可以在很少的人類監督下不斷自主改進?!?/p>方法

自修復概述

如上圖 1 所示,自修復方法包括 4 個階段:代碼生成、代碼執行、反饋生成和代碼修復。接下來正式定義這四個階段。

代碼生成

給定一個規范 ψ,程序模型 M_P 首先生成 n_p 個獨立同分布樣本,研究者將其表示為

代碼執行

然后在測試臺上執行這 n_p 個代碼樣本。研究者假設可以訪問可執行形式的全套測試,因此如果任何樣本通過了所有測試,系統就會停止,因為這時已經找到了一個令人滿意的程序。否則,系統將收集執行環境返回的錯誤消息

。這些錯誤消息要么包含編譯 / 運行時錯誤信息,要么包含程序輸出與預期輸出不同的示例輸入。示例如圖 1(組件 3)所示。

反饋生成

由于來自執行環境的錯誤消息通常非常高級,因此它們提供的修復信號很少。作為中間步驟,研究者使用反饋模型來更詳細地解釋出了什么問題;示例如圖 1(組件 4)所示。形式上,在這個階段,他們為每個錯誤的程序 p_i 生成 n_f 個反饋字符串

,具體如下所示:有了明確的反饋生成步驟,就可以消融這個組件,獨立地研究它的意義。

代碼修復

在最后一步中,對于每個初始程序 p_i 和反饋 f_ij,可以從

采樣 n_r 個候選修復程序:修復樹。研究者將該過程生成的包含文本和程序的樹稱為植根于規范中的 ψ,然后分支到初始程序 p_i,每個初始程序分支到反饋 f_ij,然后對修復樹 r_ijk 進行修復,如下圖所示。注意:聯合采樣反饋和修復。上述通用框架不要求編程模型和反饋模型相同,因此兩個模型可以使用各自的專有模型。然而,當 M_P=M_F 時,研究者在單個 API 調用中聯合生成反饋和修復的程序,因為 GPT-3.5 和 GPT-4 都有在響應中交織文本和代碼的自然傾向。形式上,研究者將其表示為pass@t:通過率與 token 數量的關系

由于自修復需要幾個非均勻成本的依賴模型調用,因此 pass@k 這種在 k 個獨立同分布樣本中獲得正確程序的可能性指標,不是用于比較和評估自修復的各種超參數選擇的合適度量。相反,研究者將通過率作為從模型中采樣的 token 總數的函數,稱之為 pass@t。

形式上,假設一個數據集 D={ ψ _d}_d 和超參數(M_P,M_F,n_p,n_f,n_r)的一組選定值。令

表示上文所述對任務 ψ _d 進行采樣的修復樹;令 size(T^i_d)表示修復樹中的程序和反饋 token 的總數;并在當且僅當 T^i_d 至少有一個葉子節點程序滿足規范中的單元測試 ψ _d 時,令 T^i_d |= ψ _d 為真。然后 pass@t 這種超參數選擇的度量被定義為希望通過這種超參數選擇生成的 token 數量時預期通過率:實驗繪制了這兩個量的 bootstrapped estimates(一種統計估計方法,通常用于評估參數估計的不確定性)。為了獲得這些數值,本文首先為每個任務規范生成一個非常大的修復樹,其中:有 N_p ≥ n_p 個初始程序樣本;每個錯誤程序有 N_f ≥ n_f 個反饋字符串;并且每個反饋串有 N_r ≥ n_r 個修復候選。給定(n_p,n_f,n_r)的設置,然后從這個凍結的數據集中對 N_t 個不同的修復樹進行子采樣(帶替換)。最后,本文計算了這 N_t 棵樹上通過率和樹大小的樣本均值和標準差。如此估計 pass@t 大大降低了實驗的計算成本,因為可以重用相同的初始數據集來計算 n_p、n_f 和 n_r 的所有不同選擇的估計。

本文所有實驗中,N_p=50,自修復方法中 n_p ≤ 25,基線無修復方法中 n_p ≤ 50。類似地,對于反饋,本文令 N_f=25 和 N_f ≤ 10。對于候選修復,由于本文在大多數實驗中對反饋和修復進行聯合采樣,因此本文設置 N_r=n_r=1。最后,本文對所有設置使用 N_t=1000。

實驗

研究者針對以下問題進行了相關實驗:

(a)在具有挑戰性的編程難題的背景下,對于本文提出的模型,自修復是否比不修復的獨立同分布采樣更好?如果是,在什么超參數下自修復最有效?

(b) 更強的反饋模型會提高模型的修復性能嗎?

(c) 即使是最強的模型,讓人參與提供反饋會帶來更好的修復性能嗎?

本文使用 APPS 數據集評估了這些關于 Python 編程挑戰的疑惑。

自修復需要強大的模型和多樣化的初始樣本

令 M_P=M_F ∈ {GPT-3.5,GPT-4},用于代碼 / 修復生成和反饋生成的是同一個模型。GPT-3.5 的結果見圖 3,GPT-4 的結果見圖 4。

從圖中可以看出,對于 GPT-3.5 模型,pass@t 在所有的 n_p、n_fr 選值中,都低于或等于相應基線(黑線),這清楚地表明自修復不是 GPT-3.5 的有效策略。另一方面,對于 GPT-4,有幾個 n_p、n_fr 值,其自修復的通過率明顯優于基線的通過率。例如,當 n_p=10,n_fr=3 時,通過率從 65% 增加到 70%,當 n_p=25,n_fr=1 時,通過率從 65% 增加至 71%。

GPT-4 的反饋改進了 GPT-3.5 自修復能力

接下來,本文進行了一個實驗,在這個實驗中,研究者評估了使用一個單獨的、更強的模型來生成反饋的影響。這是為了檢驗一種假設:即模型無法內省和調試自己本身的代碼,從而阻礙了自修復(尤其是 GPT-3.5)。

該實驗的結果如圖 5 所示(亮藍線)。研究者觀察到,就絕對性能而言,M_P=GPT-3.5,M_F=GPT-4 確實突破了性能障礙,變得比 GPT-3.5 的獨立同分布采樣效率略高。這表明反饋階段至關重要,改進它可以緩解 GPT-3.5 自修復的瓶頸。

人類反饋顯著提高了 GPT-4 自修復的成功率

在本文的最后一個實驗中,研究者考慮了在使用 GPT-4 等更強的模型進行修復時使用專業人類程序員的反饋的效果。這項研究的目的不是直接比較人在循環中的方法與自修復方法,因為人在循環方法會帶來更多的認知負擔,而本文沒有對此進行研究。相反,本文的目標是了解模型識別代碼中錯誤的能力與人類相比如何,以及這如何影響自修復的下游性能。因此,該研究對人類反饋對自修復的影響進行了定性和定量分析。

結果總結在表 1 中。我們首先注意到,當我們用人類參與者的調試取代 GPT-4 自己的調試時,總體成功率提高了 1.57 倍以上。也許不足為奇的是,隨著問題變得越來越困難,相對差異也會增加,這表明當任務(和代碼)變得更加復雜時,GPT-4 產生準確和有用反饋的能力遠遠落后于我們的人類參與者。

此外,該研究還定性地分析了人類參與者提供的反饋與 GPT-4 提供的反饋之間的差異。

只有 2/80 個人貢獻的反饋字符串包括偽代碼或顯式 Python;也就是說,獲得的幾乎所有人類反饋都是自然語言,偶爾穿插著單語句數學 / 代碼表達式。

GPT-4 的反饋更可能明顯不準確(32/80 與人類反饋的 7/80)。

GPT-4 更可能明確地建議小的變化(54/80 對 42/80;28/48 對 38/73,當看起來正確時),而我們的人類參與者顯示出更大的趨勢來建議高水平的變化(23/80 對 18/80,GPT-4;21/73 對 13/48,當看起來正確時)。

人類參與者有時會表達不確定性(7/80);GPT-4 沒有(0/80)。

進一步的分析表明,表 1 中的結果不是由于人為因素造成的,例如參與者提供了模型簡單復制的顯式代碼塊。相反,性能的差異似乎是由更準確的反饋、在需要時建議對代碼進行高級別、大規模更改的更大能力,以及參與者表達其不確定性的能力(而不是自信地給出潛在的不準確反饋)共同造成的。

THE END

轉載請聯系本公眾號獲得授權

投稿或尋求報道:content@jiqizhixin.com

標簽:

相關閱讀

大家愛看

SE宣布《正當防衛》手游被砍 下架體驗版全額退款 SE宣布《正當防衛》手游被砍 下架體驗版全額退款

SE宣布《正當防衛》手游項目被取消。該作的開發已停止,搶先體驗版今天

最近更新

国产精华7777777| 美腿丝袜亚洲综合| 国产 日韩 欧美 综合 一区| 麻豆视频在线看| 国产一级片在线播放| 99久久精品国产色欲| 国产真实夫妇交换视频| 农村老熟妇乱子伦视频| www.成年人| 在线观看亚洲色图| 免费看国产曰批40分钟| 青青草原国产免费| 久久成人资源| 成人高清视频观看www| 91精品国产高清自在线| 久热99视频在线观看| 亚洲视频一区二区| 日韩精品在线免费| 欧美人成网站| 欧美激情第四页| 91动漫在线看| 热这里只有精品| 欧美三级华人主播| 国产在线精品一区二区中文 | 中文字幕av一区| 亚洲激情在线视频| 欧美成人a∨高清免费观看| 色中色一区二区| 亚洲丝袜制服诱惑| 国产精品水嫩水嫩| 久久精品视频免费观看| 波多野结衣中文字幕一区 | 亚洲品质自拍视频网站| 国产欧美一区二区精品仙草咪| 国产精品中文字幕欧美| 国产美女视频一区| 国产精品亚洲视频| 国产成人免费在线视频| 国产一区不卡视频| 国产伦精品一区二区三区免费迷| 国产一区二区三区黄视频 | 激情五月婷婷六月| 日本免费a视频| 国产精品网站免费| 成人羞羞国产免费网站| 一本色道无码道dvd在线观看| 日本韩国欧美在线观看| 国产91在线免费| 88av.com| 伊人免费视频二| 在线xxxxx| 免费在线观看成年人视频| 黄色国产在线观看| 成年人看的免费视频| 91制片厂在线| 99免费在线观看| www.五月婷婷.com| 国产成人精品一区二三区四区五区| 国产视频在线观看免费| 狠狠躁夜夜躁av无码中文幕| 亚洲免费成人网| 亚洲人妻一区二区| 国产69精品久久app免费版| 午夜免费福利在线观看| 亚洲妇熟xxxx妇色黄| 自拍偷拍亚洲视频| 国产一区 二区| 日韩av黄色在线| 99久久婷婷| 国产欧美日韩一级| 国产一区二区女| 久久亚洲综合色一区二区三区| 亚洲国产成人午夜在线一区 | 日韩在线免费电影| 亚洲性色av| 久久久久久亚洲精品美女| 国产成人精品三级高清久久91| 欧美另类视频| 蜜桃视频第一区免费观看| 成人一级黄色片| 亚洲欧美一区二区三区国产精品 | 伊人久久婷婷| 亚洲免费综合| 卡一卡二国产精品 | 成人在线国产视频| 天天干天天草天天| 中文字幕av观看| 免费在线视频观看| 国产视频一二三四区| 日本高清中文字幕二区在线| 黄色在线播放网站| 国产亚洲精品精品国产亚洲综合| 欧美亚洲大陆| 国产精品视区| 99在线精品一区二区三区| 亚洲乱码国产乱码精品精98午夜| 在线欧美一区二区| 亚洲九九九在线观看| 91av国产在线| 久久青青草综合| 激情综合在线观看| 中文字幕精品视频在线| 草视频在线观看| 91中文字幕在线视频| 久久精品蜜桃| 日韩视频网站在线观看| 免费看成人哺乳视频网站| 国产精品久久久免费| 91色在线porny| 色老综合老女人久久久| 色婷婷**av毛片一区| 成人激情春色网| 免费久久久久久| 精品人妻一区二区乱码| 99这里只有久久精品视频| 日产欧产美韩系列久久99| 成人国产精品视频| 91国偷自产一区二区三区观看 | 加勒比av中文字幕| 国产免费无码一区二区视频 | 91porny九色| 免费资源在线观看| 99精品在线免费观看| 狠狠干成人综合网| 91蜜桃在线免费视频| 性欧美大战久久久久久久久| 精品美女在线观看| 国产成人欧美在线观看| 熟女熟妇伦久久影院毛片一区二区| 欧美色图校园春色| 久久久久久久久黄色| 北条麻妃在线| 国产乱人伦精品一区| 日本sm残虐另类| 亚洲乱码中文字幕| 亚洲国产精彩中文乱码av| 国产91色在线免费| 日韩理论片在线观看| 99国产精品免费视频| 毛片在线免费播放| 日韩欧美一起| 99久久激情| 91亚洲午夜精品久久久久久| 91精品国产免费久久综合| 日本国产欧美一区二区三区| av电影一区二区三区| 熟女少妇一区二区三区| 国产偷拍一区二区| 亚洲精品mv| 欧美天天在线| 亚洲另类一区二区| 日韩视频免费在线| 色视频一区二区三区| 国产中文字幕一区二区| 亚洲国产999| 日韩欧国产精品一区综合无码| 另类av一区二区| 亚洲国产成人porn| 欧美国产日韩免费| www国产无套内射com| 四虎884aa成人精品| 日韩精品视频无播放器在线看| 国产精品国产| 不卡在线视频中文字幕| 亚洲第一精品福利| 久久综合毛片| 亚洲精品视频久久久| 在线观看xxx| 激情综合五月| 热久久国产精品| 五月激情六月综合| 欧美激情综合亚洲一二区| 亚洲一区二区在线观| 人妻丰满熟妇aⅴ无码| 天堂中文在线看| jazzjazz国产精品久久| 成人午夜免费av| 亚洲国产精品免费| 久久资源av| 国产精品麻豆一区| 最新97超碰在线| 欧美日韩hd| 欧美日韩精品在线视频| 国产成人亚洲综合91| 天天影视色综合| 亚洲国产精品国自产拍久久| 欧美另类中文字幕| 91色视频在线| 久久精品久久久久电影| 人人妻人人澡人人爽欧美一区| 日韩精品视频免费看| 成人av三级| 九一久久久久久| 日韩精品一区二区三区第95| 视频一区国产精品| 久久久美女视频| 欧美a级在线观看| 久久99精品久久久久| 亚洲白拍色综合图区| 欧美自拍资源在线| 欧美激情精品久久| 狠狠操一区二区三区| 久久精品av麻豆的观看方式| 精品国产成人在线影院| 日韩jizzz| 国产一级二级三级| 欧美xxx视频| 成人性视频免费网站| 中文在线不卡视频| 玩弄japan白嫩少妇hd| 亚洲成a人片在线| 蜜臀91精品国产高清在线观看| 亚洲最色的网站| 欧美自拍视频在线观看| 国产精品二区视频| 免费动漫网站在线观看| 欧美精品一卡| 欧美精品第1页| 热舞福利精品大尺度视频| 国产手机在线视频| 精品99re| 亚洲欧美在线aaa| 国产精品黄色av| 在线免费观看日韩av| av在线免费网站| 激情综合网激情| 日韩在线视频观看| 日韩精品你懂的| 性网站在线播放| 99国产精品久久久久久久成人热| 制服丝袜亚洲网站| av磁力番号网| 99国产精品久久久久久久成人| 国产成人高清| 欧美综合一区二区| 亚洲欧美日产图| 亚洲熟女乱色一区二区三区久久久 | 欧美尤物美女在线| 激情综合一区二区三区| 欧美成人亚洲成人日韩成人| 亚欧精品在线视频| 日本高清视频在线播放| 久久精品国内一区二区三区| 日韩中文字幕第一页| 天天操狠狠操夜夜操| 99re热久久这里只有精品34| 精品亚洲成a人| 欧美劲爆第一页| 亚洲久久久久久| 日韩精品极品| 中文字幕一区二区三区不卡在线| 国产剧情日韩欧美| 老女人性淫交视频| av不卡一区二区| 91传媒视频在线播放| 亚洲午夜精品久久久久久浪潮| 亚洲一级在线播放| 亚洲精品中文字幕乱码| 精品国产精品一区二区夜夜嗨| 久久久久久久中文| 九色在线观看视频| 国产一区二区三区四| 57pao精品| 66视频精品| 国产精品三级av| 国产精品爽黄69| 久久精品这里有| 国产成人精品三级高清久久91| 欧美一区日本一区韩国一区| 国产1区2区在线| 欧美一区二区三区| 26uuu色噜噜精品一区二区| 成人久久18免费网站图片| 黄色大片网站在线观看| 国产剧情一区| 亚洲黄色成人网| 91精品999| 午夜欧美激情| 天天综合天天综合色| 一区二区不卡视频| 性视频一区二区三区| 成人免费毛片高清视频| 国产精品丝袜一区二区三区| 成人精品在线看| 欧美激情自拍| 久久影院中文字幕| 国产一二三四区在线| 精品三级av在线导航| 欧美xxx久久| 日韩无套无码精品| 日本www在线观看视频| 国产欧美中文在线| 麻豆传媒一区二区| 全国男人的天堂网| 精品一区二区影视| 欧美亚洲视频在线观看| 国产在线观看免费视频今夜| 婷婷综合一区| 日韩欧美久久久| 久久婷婷综合色| 中文字幕日本一区二区| 在线精品视频免费播放| 美女黄色片视频| 国内自拍中文字幕| 久久99精品波多结衣一区| 欧美日韩国产一区二区三区不卡| 88在线观看91蜜桃国自产| 鲁一鲁一鲁一鲁一av| 先锋欧美三级| 欧美精品在线观看一区二区| 中文字幕 日韩 欧美| 成人在线免费av| 91精选在线观看| 久久久久中文字幕亚洲精品| 成人黄色91| 亚洲国产成人精品电影| 性久久久久久久久久| 欧美色图五月天| 日韩亚洲欧美成人| 欧美日韩国产精品综合 | 亚洲精品美女在线观看播放| mm131美女视频| 国产成人三级| 久久这里只有精品99| 偷偷操不一样的久久| 欧美成熟视频| 2019最新中文字幕| 国产又粗又猛又爽又黄的| 极品尤物av久久免费看| 国内外成人免费视频| 免费a在线观看| 亚洲精品一二三四区| 欧美视频第一区| 伊人久久大香伊蕉在人线观看热v 伊人久久大香线蕉综合影院首页 伊人久久大香 | 亚洲少妇自拍| 成人免费视频网址| 情趣网站视频在线观看| 国产精品毛片大码女人| 国产日韩av网站| 日韩电影网站| 日韩大陆毛片av| 国产精品成人免费观看| 亚洲男人影院| 国产美女99p| 1024国产在线| 色婷婷av一区二区三区软件| 最新版天堂资源在线| 经典一区二区| 热99精品只有里视频精品| 国产午夜精品一区二区三区视频| 国产精品视频在线播放| 亚州av在线播放| 亚洲欧美另类在线| 三级视频中文字幕| 粉嫩精品导航导航| 久久人人爽人人爽爽久久| 中文字幕 欧美激情| a美女胸又www黄视频久久| 日韩一区二区高清视频| 午夜av成人| 在线亚洲午夜片av大片| 麻豆changesxxx国产| 视频一区二区三区中文字幕| 国产一区免费| dj大片免费在线观看| 91精品国产手机| 九九热国产在线| 精品一区二区三区蜜桃| 91手机视频在线| 69堂免费精品视频在线播放| 亚洲欧美日韩国产中文专区| 无码视频在线观看| 99re热这里只有精品视频| 久久久久久久久久久视频| 精品淫伦v久久水蜜桃| 日本伊人精品一区二区三区介绍| 国产精品㊣新片速递bt| 婷婷丁香久久五月婷婷| 中文字幕国产综合| 日本中文字幕一区| 成人中文字幕在线观看| 中文在线观看免费| 国产亚洲精品美女久久久| 国内老熟妇对白xxxxhd| 午夜婷婷国产麻豆精品| 亚洲天堂网av在线| 99久久精品国产导航| 色婷婷激情视频| 日韩一级免费| 成人免费在线视频播放| 国产一区二区三区不卡视频网站| 成人影片在线播放| 成人开心激情| 日韩**中文字幕毛片| 超碰免费公开在线| 精品国产欧美一区二区三区成人 | 欧美成人综合在线| 精品免费国产一区二区三区四区| 在线免费看毛片| 精品国产福利视频|