AnacondaでPythonに入門してみました!

最近、WEBスクレイピングや機械学習に挑戦してみたいと思って色々と調べていたのですが、入門書や入門セミナーにはPythonを使って説明しているものが多い印象を受けました。そこで、Python勉強のために、MacにPythonの開発環境を構築しました。

Python

Pythonとは

Pythonはプログラミング言語のひとつで、シンプルな設計が魅力で世界的に人気があるようです。PSFと呼ばれるオープンソースライセンスで提供されているので、自由に使用でき、商用に利用することも可能なようです。PSFについては、PythonのFAQページに説明がありました。

Python FAQ
https://docs.python.org/ja/3/faq/general.html#what-is-the-python-software-foundation

Pythonのインストーラは、下記リンク先の公式サイトから入手できます。

Python公式サイト
https://www.python.org

公式ドキュメント

Pythonの公式ドキュメントは下記のリンク先にあります。このページでは、Pythonのチュートリアルや言語リファレンス、標準ライブラリなどを確認することができます。

公式ドキュメント
https://docs.python.org/

データを扱うのに適したライブラリ

スクレイピングや機械学習を行なう上で、必要になりそうなライブラリを調べました。まだ実際にライブラリを使ったわけではないので、概要の紹介のみになります。

pandas

pandas
https://pandas.pydata.org/

pandasは、Pythonでデータ分析を行なうための機能を提供するライブラリです。機械学習を行なうには、学習する対象のデータを用意する必要がありますが、pandasを使えばデータの読み込みや整形などの処理が効率的に行えるようです。このため、Pythonで機械学習を行なうには、必須のライブラリとなっているみたいです。

NumPy

NumPy
https://www.numpy.org

NumPyは、Pythonで多次元配列を扱う数値計算ライブラリで、このライブラリを利用することで、多次元配列の計算を高速化できるようです。

Matplotlib

Matplotlib
https://matplotlib.org/

Matplotlibは、Pythonでグラフの描画を行なうためのライブラリで、様々な種類のグラフを作成することができるようです。

scikit-learn

scikit-learn
https://scikit-learn.org/

scikit-learnは、Pythonで機械学習を行なうための代表的なライブラリで、サンプルのデータセットが付属しているため、インストール後にすぐ機械学習を試すことができるようです。初学者が機械学習を学び始めるには、適したライブラリみたいです。

TensorFlow

TensorFlow
https://www.tensorflow.org/

TensorFlowは、近年注目されているディープラーニングに特化したライブラリです。コンピュータ囲碁プログラムAlphaGoがプロ棋士に勝利して話題となりましたが、このプログラムでもディープラーニングの手法が使われているそうです。

Beautiful Soup

Beautiful Soup
https://www.crummy.com/software/BeautifulSoup/

Beautiful Soupは、PythonでHTMLデータの構文を解析するためのライブラリです。HTMLタグやCSSのセレクタで抽出する部分を指定することができるため、効率的にスクレイピングできるようです。

Pythonのインストールについて

今回Pythonをインストールするのは、スクレイピングや機械学習を行なう為ですので、できればその処理で必要となるライブラリも一緒にインストールしてしまいたいと考えました。Python公式サイトのトップページから「Downloads」->「Alternative Python Implementations」と選ぶと下記のページが表示されます。

このページで、データサイエンスや機械学習関連アプリケーションのための「Anaconda」というディストリビューションがあることがわかりました。そこで、今回はこの「Anaconda」をMacにインストールすることに決めました。

Anaconda

Anacondaのインストール

まずAnacondaの公式ページからインストーラをダウンロードします。トップページから「Download」メニューを選ぶと、ダウンロードページに移動することができます。

Anaconda公式サイト
https://www.anaconda.com/

インストーラのダウンロードが完了したら、インストーラを実行して、あとは画面の指示に従って必要な項目を選択していきます。「インストールが完了しました。」というメッセージが表示されれば、インストール作業は完了になりますので、「閉じる」ボタンを押してインストーラを終了します。

Anacondaを起動してPythonを実行してみる

Macのターミナルで下記コマンドを実行すれば、「ANACONDA NAVIGATOR」を起動できます。

$ anaconda-navigator

今回は、ここから「Jupyter Notebook」を起動して、Jupyter NotebookでPythonを実行してみます。

Jupyter Notebookとは、ノートブックと呼ばれるファイルにプログラムやその説明文、実行結果などをまとめて管理できるツールです。Jupyter Notebookと書かれたタイルのLanchボタンをクリックすると、Jupyter Notebookを起動することができます。

Jupyter Notebookを起動するとブラウが立ち上がり、以下のようのな画面が表示されます。この画面でフォルダやファイルの作成などを行なうことができます。

新たにノートブックを作成するには、画面右側にあるNewボタンをクリックします。

表示されたメニューからPython 3を選択すると、新規のノートブックが作成され、ブラウザに表示されます。

さっそくPythonで「Hello, World」と出力するコードを書いて実行してみます。「print(“Hello, World”)」と入力して、Shift+Enterを押すとコードを実行することができます。コードを実行すると、次のように実行結果をすぐに得ることができます。

このようにコードを開発しながら実行結果をすぐに確認できるので、Jupyter Notebookはとても便利だと思いました。今回の記事では触れませんが、グラフもノートブック上に表示することができます。

これでPythonの開発環境を構築することができました!

まとめ

今回はMacにPythonの開発環境を構築する方法を紹介しました!今後Pythonの基本的な構文や今回の記事で紹介した各ライブラリの使い方について、まとめていきたいと考えています!!

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です