<big id="d1zzb"></big>

<p id="d1zzb"><del id="d1zzb"></del></p>

    <track id="d1zzb"></track>
    <pre id="d1zzb"></pre><ruby id="d1zzb"><strike id="d1zzb"><b id="d1zzb"></b></strike></ruby>
    <pre id="d1zzb"><strike id="d1zzb"></strike></pre><address id="d1zzb"></address>

    <track id="d1zzb"></track>

    <pre id="d1zzb"></pre>

      立即注冊 找回密碼

      QQ登錄

      只需一步,快速開始

      查看: 2096|回復: 0
      打印 上一主題 下一主題

      [PHP 教程] you-get 一個很強的視頻地址抓取工具的方法

      [復制鏈接]

      111

      主題

      127

      帖子

      1748

      積分

      大學四年級

      Rank: 6Rank: 6

      積分
      1748
      跳轉到指定樓層
      樓主
      發表于 2018-1-16 00:28:20 | 只看該作者 |只看大圖 回帖獎勵 |倒序瀏覽 |閱讀模式
      道勤網-數據www.staruniix.com

      親注冊登錄道勤網-可以查看更多帖子內容哦。ò蕡D片、文字詳情等)請您及時注冊登錄-www.staruniix.com

      您需要 登錄 才可以下載或查看,沒有帳號?立即注冊

      x
      前段時間,我因公司需求。所以要去研究如何拿到視屏的播放地址。一般普通的網站的視屏播放地址還是很好拿到的。但是對于優酷,騰訊這樣的大型視屏資源站就很難拿到視屏資源了。普通的網站你通過網頁就可以直接抓取到視屏的播放地址。但是這些大型就不行,這些網站都是做了防盜鏈的。就拿優酷來講,首先他用了自己的SWF播放器,然后服務器會異步加載一段參數到頁面播放器上去。播放器內部會對這些參數進行一個解析,然后獲取到視頻的播放地址。這個解析過程是比較復雜的。
        最開始我用fiddler4去抓包,還是能夠抓到很多有用信息的。最開始想用逆向JS去做,但是后來發現它的東西好像和JS關系不太大,然后我又用jsop去抓關鍵代碼,發現,他的視屏信息是通過異步加載的,表示jsoup抓不到,后來仔細觀察發現,他的請求一本都是SWF播放器發出來的,沒辦法,只能把他的SWF抓下來,做了一個反編譯后:(如果只是簡單的網頁套用的話,可以用它的swf然后去抓網頁上name="flashvars" 段的value,然后把這段value發給swf后就能播放了。)
      這邊就是主要的東西。
      大概知道優酷的大概加密方式就是
        k.youku.com/player/getFlvPath+"/sid/"+$sid+"_"+No+"/st/"+thisVideoType+"/fileid/"+id
        大概就是這個格式 sid 就是securityId 然后加上No(編號)然后后面的 fileId也是經過一系列加密的,并不是簡單的ID。一般是會有一個token  ,K ,ep 參數是比較重要的參數 最后拿這個地址你只是獲取到了一串能夠獲取播放地址的JSON
      1. [{"fileid":"0300080100579F87DDDF300157E54E465E9572-D357-57B7-15CA-646DEC5748A9.mp4","server":"http://117.41.231.17/youku/696AF5871C487D59853F424D/0300080100579F87DDDF300157E54E465E9572-D357-57B7-15CA-646DEC5748A9.mp4"}]
      復制代碼
      就如上面這個一樣,雖然server能夠獲取到視頻的地址,但是/youku/后面的那串亂碼是一個SEED加密。也就是說沒多少個小時就會變一次,也就是不可能一次拿到一個永遠不變的地址的。
        優酷的視頻下載全是走的客戶端,也就是說網頁端想要抓取地址,普通的方法是行不通的。后來我對客戶端進行一個數據抓包,然后驚奇的發現TMD根本抓不到任何有用信息,只能無奈的感嘆這客戶端太尼瑪屌了。每次我點擊下載新視頻后再看看抓包信息,空空如也像什么也沒發生過。沒辦反只能走反編譯的路了。。(反編譯工具免費版只能看,,不能復制更別說調試了。。、。。我操。。。)
            扯了這么多,現在進入正題了。you-get 是一個強大的抓取視頻的工具,原理就是上面的swf反編譯后抓取了加密方式,然后對網頁請求進行一個解析,然后從視屏站服務器中騙取地址出來。
           首先這個語言是基于Python 的 先去官方下載最新的(至少3.0以上)的版本,因為這個版本自帶pip3.下好后配好環境
           這邊我就不多說了:http://www.jianshu.com/p/a3f8df948395
           然后打開cmd命令 輸入
      1. pip3 install --upgrade you-get
      復制代碼
      來獲取 you-get 獲取成功后基本的使用方法上面鏈接有。
           接下來就是關鍵了。
           如果你是只想獲取地址的話可以在前面 加  命令
      1. --json
      復制代碼
      1. you-get --json  youwannaURL
      復制代碼
       即可獲取到地址
      通過pip3安裝的東西一般放在 你的Python文件夾/Lib/site-packages/  下
        extractor.py 是main 層后的 功能能層。 可以進去看看 有很多方法 ,比如
      you-get  URL這種不帶參數的話 就會執行這個download 的第一個if 的else語句 直接下載視頻。如果有了 --json 參數的話,就是執行的這個if
      下載的功能在 common.py里面
      可以向我這樣加一段來輸出看;蛘哂胷eturn阻斷下載,。
      回到輸出json這邊來在json_output.py 下
      可以向我這樣,選取自己需要的字段,然后用文件的形式把它輸出。皆大歡喜,拿到了地址了。
      更多想要的功能可以自己改代碼~

      道勤主機提供365天*24小時全年全天無休、實時在線、零等待的售后技術支持。竭力為您免費處理您在使用道勤主機過程中所遇到的一切問題! 如果您是道勤主機用戶,那么您可以通過QQ【792472177】、售后QQ【59133755】、旺旺【詮釋意念】、18513761280免費電話、后臺提交工單這些方式聯系道勤主機客服! 如果您不是我們的客戶也沒問題,點擊頁面最右邊的企業QQ在線咨詢圖標聯系我們并購買后,我們為您免費進行無縫搬家服務,讓您享受網站零訪問延遲的遷移到道勤主機的服務!
      本內容系 道勤團隊 www.staruniix.com 客服與技術人員研究整理的智慧結晶,轉載勿用于商業用途,并保留本文鏈接,侵權必究!


      分享到:  QQ好友和群QQ好友和群 QQ空間QQ空間 騰訊微博騰訊微博 騰訊朋友騰訊朋友
      收藏收藏 分享淘帖 支持支持 反對反對 贊助我們
      copy_link 

      【道勤網】- www.staruniix.com 軟件視頻自學教程|免費教程|自學電腦|3D教程|平面教程|影視動畫教程|辦公教程|機械設計教程|網站設計教程!【道勤網】 - 論壇版權1、本主題所有言論和圖片純屬會員個人意見,與本論壇立場無關
      2、本站所有主題由該帖子作者發表,該帖子作者與【道勤網】- www.staruniix.com 軟件視頻自學教程|免費教程|自學電腦|3D教程|平面教程|影視動畫教程|辦公教程|機械設計教程|網站設計教程!【道勤網】享有帖子相關版權
      3、其他單位或個人使用、轉載或引用本文時必須同時征得該帖子作者和【道勤網】- www.staruniix.com 軟件視頻自學教程|免費教程|自學電腦|3D教程|平面教程|影視動畫教程|辦公教程|機械設計教程|網站設計教程!【道勤網】的同意
      4、帖子作者須承擔一切因本文發表而直接或間接導致的民事或刑事法律責任
      5、本帖部分內容轉載自其它媒體,但并不代表本站贊同其觀點和對其真實性負責
      6、如本帖侵犯到任何版權問題,請立即告知本站,本站將及時予與刪除并致以最深的歉意
      7、【道勤網】- www.staruniix.com 軟件視頻自學教程|免費教程|自學電腦|3D教程|平面教程|影視動畫教程|辦公教程|機械設計教程|網站設計教程!【道勤網】管理員和版主有權不事先通知發貼者而刪除本文

      加入道勤網VIP-www.staruniix.com-享受建站指導服務!
      您需要登錄后才可以回帖 登錄 | 立即注冊

      本版積分規則

      關閉

      道勤網- 推薦內容!上一條 /2 下一條


       
       
      技術支持
      在線客服
      點擊這里給我發消息
      點擊這里給我發消息
      道勤建站群:
      3群建站-美工交流-道勤
      道勤美工群:
      3群建站-美工交流-道勤
      工作時間:
      8:00-18:00
      客服熱線:
      15056962695
      官方微信掃一掃
      !jz_fbzt! !jz_sgzt! !jz_xgzt! 快速回復 !jz_fhlb! !jz_lxwm! !jz_gfqqq!

      關于我們|手機版|小黑屋|地圖|【道勤網】-www.staruniix.com 軟件視頻自學教程|免費教程|自學電腦|3D教程|平面教程|影視動畫教程|辦公教程|機械設計教程|網站設計教程【道勤網】 ( 皖ICP備15000319號|贊助我們  

      GMT+8, 2022-9-9 23:22

      Powered by DaoQin! X3.2 © 2016-2063 Dao Qin & 道勤科技

      快速回復 返回頂部 返回列表
      肉欲精油按摩

      <big id="d1zzb"></big>

      <p id="d1zzb"><del id="d1zzb"></del></p>

        <track id="d1zzb"></track>
        <pre id="d1zzb"></pre><ruby id="d1zzb"><strike id="d1zzb"><b id="d1zzb"></b></strike></ruby>
        <pre id="d1zzb"><strike id="d1zzb"></strike></pre><address id="d1zzb"></address>

        <track id="d1zzb"></track>

        <pre id="d1zzb"></pre>