- 2021.05.31
LightGBMのインストール方法と使い方
こんな人におすすめ:・LightGBMのインストール方法が分からないので教えて欲しい・scikit-learnより高速な勾配ブースティングを実装したい 開発環境 Python 3.7.3 LightGBM 3.2.1scikit-learn 0.24.2Pandas 1.2.4 IDE:jupyter Notebook LightGBMのインストール インストールはGithubリポジトリに記載の公 […]
こんな人におすすめ:・LightGBMのインストール方法が分からないので教えて欲しい・scikit-learnより高速な勾配ブースティングを実装したい 開発環境 Python 3.7.3 LightGBM 3.2.1scikit-learn 0.24.2Pandas 1.2.4 IDE:jupyter Notebook LightGBMのインストール インストールはGithubリポジトリに記載の公 […]
こんな人におすすめ:・listとadarrayの使い方をド忘れした・使い方をググったらここに辿り着いた 機械学習をやってると、listとかNumPy配列のndarrayを扱う機会が多いので、一度自分のための備忘録として使い方をまとめておきます。 開発環境 Python 3.7.3NumPy 1.20.2 作成 listは[]、ndarrayはnp.array()で作成。 初期化 スライス スライス […]
こんな人におすすめ:・他クラス分類のモデル評価方法を学びたい・\(macroF_1\)の意味がよく分からないので教えて欲しい 最近機械学習のコンペに参加しているのですが、評価関数として\(macroF_1\)を使っているものがありました。 知らなかったので、良い機会だと思って記事にまとめておきます。 \(macroF_1\)は数式で表すと以下の通りですが、 \(\displaystyle macr […]
こんな人におすすめ:・勾配ブースティングをscikit-learnで実装したい・どのパラメータを調整すれば良いか教えて欲しい 結論として、scikit-learnのGradientBoostingClassifierクラスを使えば簡単実装できます。 また、調整すべきパラメータは、n_estimaters(決定木の数),learning_rate(学習率),max_depth(決定木のノード深さ)の […]
こんな人におすすめ:・kaggleを始めてみたいが始め方がよくわからない 数ヶ月前にユーザーアカウントだけ作って放置していたkaggle。 いまいちやり方というかノリが分からず放置していたのですが、転職を機にまとまった時間ができたのでトライしてみることにしました。 まだ1日しかまともに触っていなくて初心者もいいところなのですが、 これから始めてみたいという方の参考になればと思って記録を残しておきま […]
こんな人におすすめ:・ランダムフォレストをscikit-learnで実装したい・どのパラメータを調整すれば良いか教えて欲しい 結論として、scikit-learnのRandomForestClassifierクラス(もしくはRandomForestRegressionクラス)を使えば簡単実装できます。 また、調整すべきパラメータは、n_estimaters(決定木の数),max_features( […]
こんな人におすすめ:・scikit-learnによる機械学習の実装について学びたい・決定木の原理を詳しく知りたい 結論として、決定木はscikit-learnのDecisionTreeClassifier(もしくはDecisionTreeRegressor)で簡単に実装できます。 一方で原理は単純なので多くの人が感覚的には理解できていると思います。 しかし、どうやって最適な分割条件を決めるかまで詳 […]
こんな人におすすめ:・K-means法をscikit-learnで実装したい・教師なし学習について学びたい 結論として、scikit-learnでK-means法を実装するのは極めて簡単で、sklearn.clusterモジュールのKMeansクラスに学習させるデータとクラス分けの数を入れるだけです。 ここでは、実装手順に加えてK-means法の原理についても簡単に説明していきます。 それでは順を […]
こんな人におすすめ:・部分空間法の原理を感覚的に学びたい・はじパタ9章を読んだけど、意味がわからないので解説してほしい 部分空間法とは 部分空間法とは、データの全体のベクトル空間を識別クラスごとの部分空間に分けて、その部分空間への射影の大きさを比較することでクラス分類をする手法です。 例えば、話を単純化してデータ全体が3次元のベクトル空間だとしましょう。 訓練データが下のように2クラスある場合に、 […]
こんな人におすすめ:・主成分分析について感覚的に原理を理解したい・はじパタ9章がいまいち理解できなかった 主成分分析の感覚的な説明 主成分分析とは、簡単にいうと学習データの分散が最大になるように空間を回転させた時の”軸”について考察する分析手法です。 たとえば、下のような2次元のデータで考えてみましょう。 このデータは横軸にアヤメの花びらの長さ(petal lengh)を、縦軸に花びらの幅(pet […]