2017年11月12日 星期日

從 Jupyter 讀取 Windows 磁碟中的鐵達尼號資料

在書上的範例中,提到用鐵達尼號的資料做分析
不過書上範例所指的資料位址已經無法存取了。
稍微搜尋了一下,發現 Kaggle 也有提供這個資料 [1],而且是免費的。

從 [1] 下載資料下來之後,假設是放在 D:\test\data\titanic 這個資料夾裡,訓練用的資料命名為 train.csv

import pandas

training_data_path = "D:\\test\\data\\titanic\\train.csv"

# Read training data.
training_data = pandas.read_csv(training_data_path)
print(training_data)

路徑要記得跳脫,才能正確找到檔案。

參考資料
  1. Kaggle - Titanic: Machine Learning from Disaster
  2. Read a .csv into pandas from F: drive on Windows 7

沒有留言:

張貼留言