こんな人におすすめ:・K-means法をscikit-learnで実装したい・教師なし学習について学びたい 結論として、scikit-learnでK-means法を実装するのは極めて簡単で、sklearn.clusterモジュールのKMeansクラスに学習させるデータとクラス分けの数を入れるだけです。 ここでは、実装手順に加えてK-means法の原理についても簡単に説明していきます。 それでは順を […]
こんな人におすすめ:・部分空間法の原理を感覚的に学びたい・はじパタ9章を読んだけど、意味がわからないので解説してほしい 部分空間法とは 部分空間法とは、データの全体のベクトル空間を識別クラスごとの部分空間に分けて、その部分空間への射影の大きさを比較することでクラス分類をする手法です。 例えば、話を単純化してデータ全体が3次元のベクトル空間だとしましょう。 訓練データが下のように2クラスある場合に、 […]
こんな人におすすめ:・主成分分析について感覚的に原理を理解したい・はじパタ9章がいまいち理解できなかった 主成分分析の感覚的な説明 主成分分析とは、簡単にいうと学習データの分散が最大になるように空間を回転させた時の”軸”について考察する分析手法です。 たとえば、下のような2次元のデータで考えてみましょう。 このデータは横軸にアヤメの花びらの長さ(petal lengh)を、縦軸に花びらの幅(pet […]
こんな人におすすめ:・seabornの基本的な使い方を学びたい・Pythonでキレイなグラフを描きたい seabornはデータの視覚化のためのツールで、Matplotlibのラッパーライブラリです。 つまりMatplotlibをベースとして使って、よりキレイにグラフを作成できるように工夫されたライブラリとなっています。 特に設定に気を使わなくても比較的キレイなグラフが描けるので、扱いに馴れるとグラ […]
こんな人におすすめ:・データの標準化と無相関化についてPythonで学びたい・機械学習の入門で「はじパタ」を読んでいるが難しいので解説して欲しい 開発環境 Python 3.7.3 scikit-learn 0.24.2NumPy 1.20.2Pandas 1.2.4seaborn 0.11.1 使用するデータ:iris/sklearn.datsets エディタ:jupyter Notebook […]
こんな人におすすめ:・ナイーブベイズの実装方法についてPythonで学びたい・機械学習の入門で「はじパタ」を読んでいるが難しいので解説して欲しい 機械学習の理論的理解のために、最近「はじめてのパターン認識」を読んでいます。 Pythonユーザーである私は、プログラムを書きながら具体的に理解していくという方法をとっっているので、その記録を残しておこうと思います。 ということで今回は、はじパタ3章をP […]
こんな人におすすめ:・学習済みモデルの評価方法についてPythonで学びたい・機械学習の入門で「はじパタ」を読んでいるが難しいので解説して欲しい 機械学習をしっかり学びなおそうと思って、最近「はじめてのパターン認識」を読んでいます。 しかし残念ながらPythonでの実装例が無いので本書を読むだけでは、理論の理解に留まり実践的ではありません。 ということで今回は、はじパタ2章をPythonで実装しな […]
こんな人におすすめ:・jupyer Notebookの便利な使い方を知りたい・jupyer Notebookでグラフを書くことが多い 結論として、「ipywidgets」というライブラリを使うことでインタラクティブなGUIを作ることができます。 それでは、順を追って使い方をみていきましょう。 開発環境 MacOS Big Sur 11.2.1Browser: Google Chrome jupyt […]
こんな人におすすめ:・iPhoneでTensorFlowによる学習済みモデルを動かしたい・TensorFlowLiteの使い方を知りたい こんな人にはおすすめでない:・PCがMacでない(残念ながらXcodeが使えないと今回の手順は実行できません) 開発環境 ・MacOS Big Sur 11.2.1Xcode 12.5(iOSアプリ開発のために必要)CocoaPods 1.10.1(Tensor […]
この記事はこんな人におすすめ:・最小二乗法についてきちんと理解したい。・エクセルの近似曲線が引かれる仕組みをしりたい。 この記事はこんな人にはおすすめでない:・微分を理解していない データのあふれる現代社会。 データ分析のプロでなくとも、オフィスで働いていたら自然とデータを処理する機会に直面してしまうことでしょう。 たとえばエクセルでデータをプロットして、近似曲線をソフトにおまかせでシャッと引くな […]