我是李大為 (David Lee),是前微軟資料與應用科學家,目前在一家私募量化裡做機器學習量化策略研究。自許為 maker —— 努力實現任何想到的有趣點子。我喜歡音樂和其他我覺得很酷的東西。有輕微的強迫症,做事必須要有條理,特別是在coding上必須規範且優雅。秉持能隨便就隨便但要拘謹就該嚴格的人生哲學(自稱為「真值表哲學」),簡化太過複雜的人生,努力為了變得更懶惰而勤勞。學習上,求知若渴,虛心若愚,也不吝於與他人分享自己的所學,正所謂開源精神。
軟件工程 工學碩士, 2021
北京大學
電子工程 工學學士 (輔修財金), 2017
國立臺灣科技大學
當一個人對一件事足夠感興趣,那麼他將會努力讓它成為自己的專長之一。
Python 機器學習
C/C++ 嵌入式系統設計
Node.js 後端設計
Java Android App 設計
C# Unity 遊戲設計
Verilog HDL FPGA 晶片設計
Matlab, R 數學統計計算
熟練使用 Vim
爵士鼓
吉他
鋼琴
管樂團打擊樂
宅錄
攝影
咖啡(拉花、手沖)
溜滑板
魔術方塊
3D 列印
直排輪
騎腳踏車
滑雪
騎摩托車
飛無人機
一生只活一次,所以放手一搏吧!
工作 / 實習
Doing case of Anti-healthcare fraud and Medical record analysis.
Including research of:
北大學位論文: 面向中文文本的數值事實抽取方法設計與實現
Ecojoy
We want to solve the problem of “Toy waste”. Excessive pollution not only affects the physical environment of future generations but also cultivates children who do not cherish resources, which has a major impact on the world. We hope that through a very simple way, every old toy will no longer be piled up at home or enter the landfill, but can also become a resource for others. We have software engineering, social education, and economics background. Observing that the problem of toy waste is becoming more and more serious, it is readily available and cheap, becoming a quick solution for most parents to deal with their children. We believe that as long as the sharing and acquisition methods are simple enough, it can immediately improve the situation of excessive waste. Through subscription to become members of Ecojoy App, you can easily share excess toys at home, and through the perfect toy information and rating system on APP, users can easily find suitable toys to meet their needs and achieve toy sharing and reuse.
In this competition, each sample is a time-series data of a concrete pump vehicle. The goal is to predict the likelihood of each data sequence that whether a machine might fail. I used LightGBM and reach Top 5% in rank.
課外項目 / 課程項目 / 原始碼
自學課程,其中包括 word2vec、dependency parsing、machine translation、question answering 等 projects。
SemEval-2013 Task 13 Word Sense Induction for Graded and Non-Graded Senses.
Kaggle 的比賽,目標是要判斷一些網路上的評論是否為 toxic。
SemEval-2018 Task 7 Semantic Relation Extraction and Classification in Scientific Papers.
基於特徵工程的比賽,對於 time-series 的運轉數據預測其故障的可能性。
PKU OS course project and notes based on Nachos and XV6
搭建 2048 AI BOT。在 2014 年的比賽中搭建 MCTS 版本,並於 2018 年的 AI 課程中搭建強化學習版本。
開源的 quick-start 工具,可以快速搭建 Raspberry Pi Cluster 並搭載一些著名的 ecosystem 例如 Hadoop, Spark 等。
實作神經網路,其中包含各種如 NLP、RL、CV 相關 topcis 的項目。
從零實作機器學習演算法,其中包含許多課程項目與筆記。
大學畢業專題。從零打造四軸直昇機,並且在多種不同的開發平台上運行,並結合電腦影像技術做自動控制。獲得校內最佳專題獎、最佳人氣獎。