There are some Selenium functions or techniques that I haven’t used before and I don’t know how to write them like this, or they are less intuitive; because they are all fragmented, I will organize them into this article. 有些 Selenium 功能或技巧,沒用過不知道應該要這樣寫,或是比較不直覺的做法;因為都比較零碎,我將它整理到這篇。
Python
經典 NLP 任務標籤生成:串接非官方 ChatGPT API
這篇文章紀錄我串接非官方 ChatGPT API 「試圖」取得 NLP 資訊抽取任務標籤的過程。結論是…
【自然語言處理】基於語義角色標註的事件三元組抽取實作
本文介紹自然語言處理中的經典任務之一:語義角色標註,並分享開源專案「事件三元組抽取」如何利用語義角色標注的結果,以及復現心得、改良想法
【Python 網路爬蟲】克服網站反爬蟲機制的 8 種做法
隨著公開資料使用的普及化,網站對自家資料的保護也越來越嚴謹。開發者如何在符合道德和不觸發網站擋爬機制的同時,合法取得所需 …
【Python】複製一份 conda 環境的各種方式
使用 .yml 檔案 將當前環境設置輸出為 environment.yml ,再用來創建配置一致的新環境 更新現有環境 …
資料科學競賽分享 (I) – 2020 Shopee Code League (附 github 連結)
第一個參加的跨國大型資料科學競賽,8場小比賽都有全勤參與;但人生很難,top1%更難,過程中往往望大神興嘆。為了振作起來 …
資料科學初學者建模易犯的錯誤盤點
並非每次我們接觸到的資料,針對每一個預測標的,都有獨立、整理好的特徵值;尤其是在面對時間序列資料時,我們也希望捕捉預測標 …
【自然語言處理】認識文本分析|給我一段話,我告訴你重點在哪:對文本重點字詞加權的TF-IDF方法
適逢上週五2019數位奇點獎,敝公司獲得【最佳數據科技創新獎】銅獎;當中的案件我們使用到tfidf產生的文本向量做KMe …
【自然語言處理】認識文本分析|Word2Vec, Doc2Vec 比較 (附Python程式碼)
本篇筆記 Python自然語言處理入門的常用方法 Word2Vec,及其延伸:Doc2Vec,表述他們之間的關聯,並以P …