1. ローカル PC からファイルをアップロード
from google.colab import files
uploaded = files.upload()
2. Google Drive からファイルを入手
pip install -U -q PyDrive
from pydrive.auth import GoogleAuth
from pydrive.drive import GoogleDrive
from google.colab import auth
from oauth2client.client import GoogleCredentials
# Authenticate and create the PyDrive client.
auth.authenticate_user()
gauth = GoogleAuth()
gauth.credentials = GoogleCredentials.get_application_default()
drive = GoogleDrive(gauth)
3. URL を指定してファイルを読み込む
!wget [URL]
4. 同一 Google アカウントに結び付けられている Google Drive からデータを読み込む
この場合話は簡単になります。以下の手順を見てください
- Google Drive の中に
data
というフォルダがあらかじめ作ってあったとしましょう。 - この
data
フォルダの中に前もってデータをアップロードしてあるとします。 Colab
上では以下のようにタイプします
from google.colab import drive
drive.mount('/content/drive')
-
すると認証手続きを経て `/contents/drive/My Drive’ から自分の Google Drive 上に保存されているファイルにアクセス可能になります。
-
GitHub
から直接ファイルを読み込む GitHub のデータセットを開いてクリックview raw
をクリックしてください。そしてそのリンク先の URL をコピーペーストすればデータを読むことができます。
import pandas as pd
url = 'an_URL_somewhere_on_the_GitHub'
df1 = pd.read_csv(url)
- pandas とは Python でデータファイルを活用するためのライブラリ
- GitHub 上のデータファイルを示す URL 名
- GitHub 上の URL を pandas のデータフレームに読み込む
python のコメントは 2 種類
#
と 三連引用符 と
三連引用符は docstrings
に使用されます。docstrings
PEP258