量化網站(從事量化行業)

我是一位剛上大學的大學牲,莫名其妙的對Python和金融工程感興趣,而在閱讀瞭很多相關領域的文章之後,漸漸地接觸到瞭“量化”這一行業的一些知識。相信和其他初次看到這個行業的人一樣,先是疑惑,於是開始搜集資料,看完之後便更加疑惑瞭。我看到瞭網上的很多說法,有人說這個行業前景好,也有人說這個行業不行。或許有很多人都不反駁這個行業很看重學歷,我本身對於學歷高這一點並沒有疑惑之處,畢竟追求高學歷本就是我一直以來堅持的事情(絕對不是被逼的)。而讓我疑惑的點自然是比較現實的薪資問題與地域選擇問題,畢竟未來如果考研的話一定是要綜合學校的招牌和未來發展等各方面的,因此寒假在傢閑的慌的我便用微不足道的能力做瞭一點點研究,下面便來與大傢分享一下研究過程和結論。首先,我要在此說明的,這篇文章是我記錄學習過程的一個渠道,所研究出來的結論並不一定正確,希望各位讀者可以包容錯誤,不吝指教,歡迎在評論區討論並給我提出建議。對於我的研究過程,大致分為數據采集、數據清洗、數據分析建模和總結這四個部分,為瞭保證數據的可靠性,我也是采取瞭Python爬蟲爬取Boss直聘網和獵聘網這兩個網站的量化行業就業信息,眾所周知,Boss直聘是世界杯的贊助商,因而我認為其數據是比較靠譜的。爬取過程對於數據的采集,我直接采取瞭Python爬蟲爬取Boss直聘網和獵聘網這兩個網站關於量化行業的就業信息。這裡對於爬取過程也不多說,隻說一些我在爬取Boss直聘網時遇到的一些問題和註意事項吧。首先,Boss直聘網采取的是動態渲染的形式(在導航欄搜索“量化”之後),因此必須使用selenium模塊來模仿瀏覽器從而獲得網頁源代碼,或者可以采用接口突破的方式。這裡有一個有趣的點,Boss直聘網首頁的就業信息是可以直接requests庫爬取的,所以我一開始直接把之前爬取首頁數據的代碼進行修改後就開始爬取,結果鬧瞭半天都沒有爬到數據,真的印證瞭從事計算機行業經常聽到的一句話“一杯茶一包煙,一個bug改一天”,這裡把這個過程記錄下來,一是防止讀者也有因為偷懶而犯同樣錯誤的,二是對我自己起到一個反省的作用。其次,在爬取Boss直聘網時,我發現我的selenium模塊就像是著瞭魔一樣,會一直不斷刷新網頁,最後就導致瞭IP被封禁的問題(如下圖),這裡我也是在網上找瞭好久解決方案,但是最後都沒能很好地解決問題。不知道讀者有沒有遇到相同的情況,如果遇到瞭的話希望可以在評論區分享討論一下解決方法,而我這裡直接買瞭一些代理IP進行瞭硬核嘗試,最後也算是解決瞭問題嘿嘿。這裡也可以先提供幾個思路,可以讓遇到相同問題的uu們去嘗試一下,一個就是嘗試保存cookie值模擬登陸後再訪問爬取,另一個就是網上也提到過的網頁緩存的問題,希望可以幫助解決問題。最後,對於Python爬蟲中xpath的使用我也總結瞭一些經驗以及一些插件的使用,這些經驗對於爬蟲大佬來說可能並不算什麼,但是對於初學者來說還是蠻有用的,畢竟我當時遇見這些問題時也是查閱瞭很久的資料才得以解決,因此這裡我想後面再單獨寫一篇文章分享經驗和插件的使用,希望大傢可以關註我從而第一時間和我討論問題交流學習。數據清洗過程在這個過程中,我主要是去掉瞭一些非量化行業的數據以及工資的標準為“面議”的一些數據,並且把工資數據進行處理,獲得最低工資和最高工資,緊接著將其轉換為int類型,這樣的話在後面分析的時候變回更加方便更有說服力。其中我在後面的數據分析環節隻對於城市有要求,因此對於爬取的城市信息我進行瞭簡單的處理從而隻保存瞭城市的城市而對於區的信息則沒有保存。數據清洗過程主要是看個人的需求和想法,處理方式千千萬,我也沒有遇到什麼問題,因此這裡也就不多贅述瞭。數據分析過程對於數據的分析,我先是分析瞭每個城市對於量化崗位的招募情況,利用Python建模得到瞭以下圖表:從招聘信息的所在地來看,對量化崗位需求量較大的是三個一線城市,其中上海和北京分別位列前兩位。除瞭北上深和杭州外,其他熱門城市的需求並不大,所以,如果未來想從事量化相關的工作,最好還是去一線城市尋找相應的機會。但是單憑這一點是無法確定我未來考研的地方選擇的,於是我便對各個城市量化崗位的最低工資和最高工資的平均值進行瞭分析,得到瞭以下圖表:從上面連個表可以看出雖然武漢和香港對於量化崗位的需求量很少,但是其平均薪資很高,甚至超過瞭上海和北京的平均薪資,而其他的一些城市則是不如上述的城市,這裡可以補充一點,由於我現在在武漢讀大學,對於武漢的瞭解還是多一點,因此也單獨研究瞭一下武漢量化崗位的就業信息。從數據不難發現,武漢對於量化的需求並不多,但是大多集中在武漢光谷區域也就是武漢東湖新技術開發區,這個地區的技術發展是十分迅速和高新的,並且相對而言對於量化崗位所給出的工資都非常的高。相對於北上廣深,武漢的物價較為便宜,因此如果能在武漢找到一份很好的量化崗位,留在武漢是性價比比較高的一個選擇。雖然對於我個人,未來留在武漢發展是比較好的一個選擇,但是作為年輕人的我還是想去北京上海拼一拼搏一搏,因此我便單獨對於北京、上海、深圳的量化崗位最低工資和最高工資分佈情況進行瞭研究,得到瞭以下表格:從這張圖中得到的信息也是讓我比較驚訝,圖表顯示其實三個城市的工資分佈都呈現一個差不多的趨勢。現在想想其實也比較正常,畢竟都是一線城市,而且又都是在公眾的招聘網站上發佈的招聘信息,他們的工資區間重合並不意外,因此在這一方面還不能妄下結論,等未來有機會得到更多更優質的數據再進行分析,或許情況便會大不一樣。當然,這裡也歡迎大傢有經驗的讀者在評論區分享你們的經驗和看法。最後對於從事量化行業未來的學習方向我也是利用這些數據做瞭簡單的分析,抓取瞭各個公司招聘時的詳細要求,並且處理出其中包含的關鍵詞,我將關鍵詞分為Python/R,金融,數學,計算機,c++等大類,雖然在分類上略有不妥,但是對於我個人而言還是有比較重要的參考價值的嘿嘿,得到的圖表如下:從表格中可以看出,量化行業對於金融專業知識和Python這一技能的要求比例都是比較高的,這樣也解釋瞭為什麼我在對金融工程和Python感興趣後就漸漸地接觸到瞭量化這一行業,而我的同學卻並不知道這一行業的信息。未來我也會在我感興趣的領域進行深耕,今天這篇文章也就在此瞭瞭結尾瞭。希望各位讀者也可以在自己喜歡的領域一馬平川哈哈,本文如有什麼不對不妥希望大傢在評論區或者私戳我指正。

本文出自快速备案,转载时请注明出处及相应链接。

本文永久链接: https://www.175ku.com/41983.html