DEVELOPER’s BLOG

技術ブログ

統計検定 数理 2019 問1 解答

2019年11月24日に実施された統計検定1級を受験しました! 略解は既に公開されているのですが、改めて勉強したい人(僕もその1人ですが...。)のために解答を共有します。 少しでも役に立つと嬉しいです。。。 本記事では統計数理の問1、次記事で問2を解説していきます。 [1] 確率母関数の1階および2階微分はそれぞれ \[ \frac{d}{dt}G_{X}(t) = \sum_{k} kt^{k-1}P(X=k) \] \[ \frac{

記事詳細
統計検定 数理 2019 問1 解答
統計学
機械学習を社会に実装する

目次 はじめに:機械学習の社会実装 自動運転は実現可能か? 人間は機械学習技術を使いこなせるか? 機械学習の判断を人は受け入れられるか? 『より良い』とは? おわりに はじめに:機械学習の社会実装 『機械学習』という言葉を聞いて何を思

記事詳細
機械学習を社会に実装する
コラム 統計学
機械学習とは?学習の種類や予測プロセスの紹介

もくじ 機械学習の概要 人工知能と機械学習の違い 機械学習の種類 機械学習のプロセス 機械学習のこれからの発展 まとめ 機械学習の概要   機械学習とは与えられたデータからデータに潜む規則性を自動的に発見し、データの分類や未知のデータの予測をコンピュータの計算手法を利用して行うことである。データから予測を行うとき、扱うデータによっては膨大な規則を用いたり、人力では見つけることの難しい規則が存在したりするので、人間だけでは予測が困難な場合があるが、それをコン

記事詳細
機械学習とは?学習の種類や予測プロセスの紹介
コラム 機械学習
機械学習ができること/できないこととビジネスでの業種別活用事例

「機械学習」 耳にすることが多くなった単語ですが、そもそも機械学習ってなんでしょうか。 AI(人工知能)との違いは?なにが出来てなにが出来ないのでしょうか? 本日は上記を解説し、実際に活用されている事例をご紹介します。 機械学習とは 機械学習はAIの1つの要素です。 AIの中に機械学習があり、機械学習にディープラーニング(深層学習)があります。 機械学習とは... 大量のデータの特徴や法則を捉え、未知のデータを予測・分類する。 分析の精度は100%ではない

記事詳細
機械学習ができること/できないこととビジネスでの業種別活用事例
利用事例 機械学習
機械学習でひみつ道具『ムードもりあげ楽団』の実現を考えた

アクセルユニバース株式会社(以下 当社)では『機械学習・深層学習で世界を笑顔にする』を掲げ、人が対応している業務を画像認識、音声認識、文字認識等を活用して効率化する機械学習ソリューション開発をおこなっています。 今日は世界を笑顔にしたい私が 「ドラえもんのひみつ道具があれば、みんな笑顔になるのではないか!?」と機械学習を活用してひみつ道具の実現を考えてみました。 目次 ひみつ道具の検討 実現したいこと 結果と今後 ひみつ道具の検討 ずばり、今回実現を検討し

記事詳細
機械学習でひみつ道具『ムードもりあげ楽団』の実現を考えた
コラム 利用事例 機械学習
[機械学習 × 音楽]MIRとよく使われる特徴量

はじめに 現代社会には、音楽というものが氾濫しています。 そして多くの人は音楽を聞くというと、生演奏されているものを聞くことよりもCDやサブスク型サービスなど、一度デジタルなデータになったものをアナログデータへ変換して視聴することの方がよっぽど多いでしょう。 このデータ化によって普段聞いているだけでは気づかないような、特徴、性質に目を向け、そういった見えなかったデータを使い既存のものをもっと充実させる、新しいものを作り出すことはできないでしょうか。 この

記事詳細
[機械学習 × 音楽]MIRとよく使われる特徴量
利用事例 機械学習
文系学部2年生の私がコンペ初参加で「SIGNATE」上位8%に入った話(解法)

この記事では、3ヶ月前までデータサイエンスと無縁だった私が、 マイナビの家賃予測コンペで上位8%(スコア14953)に達した解法について紹介したいと思います。 始めまして、 アクセルユニバース株式会社、インターンの土井です。 ここで紹介するSIGNATEの解法は、私が始めて間もないこともあり、シンプルな解法ばかりです。 幅広いレベルの方の参考になれると思います。 コンペの概要 https://signate.jp/competitions/182 東京23

記事詳細
文系学部2年生の私がコンペ初参加で「SIGNATE」上位8%に入った話(解法)
機械学習
Kaggle初心者が「地震コンペ」をやってみた

目次 このブログの対象者 地震コンペの概要 私が地震コンペを始めた理由 Kaggle初心者が地震コンペをやるまで 地震コンペの情報収集 参考にするNotebookの解読 特徴量の作成 モデルの作成 結果 考察 今後 1. このブログの対象者 Kaggle初心者 Kaggle入門者用のTitanicや住宅価格コンペの次に挑戦したいが進め方に悩んでいる人 地震コンペ(LANL Earthquake Prediction)のような時系列の信号データの分析に興味を

記事詳細
Kaggle初心者が「地震コンペ」をやってみた
kaggle 機械学習
インタビュー記事:社内kaggle Expertのメダルまでの取り組み

アクセルユニバース株式会社(以下当社)では、人が対応している業務を画像認識、音声認識、文字認識等を活用して効率化する機械学習ソリューション開発をおこなっています。 インターン生はその一環としてkaggleコンペに挑戦しており、本日はkaggle Expertになった山口くんに取り組みをインタビューしました。 kaggleコンペに挑戦している方、これから機械学習の勉強を始める方は是非参考にしてください! 目次 山口くんの紹介 kaggleコンペ挑戦 kagg

記事詳細
インタビュー記事:社内kaggle Expertのメダルまでの取り組み
kaggle
画像セグメンテーションのためのU-net概要紹介

U-netとは U-netはFCN(fully convolution network)の1つであり、画像のセグメンテーション(物体がどこにあるか)を推定するためのネットワークです。 生物医科学(biomedical)の画像のセグメンテーションを行うために2015年に発表されました。 (論文URL : https://arxiv.org/abs/1505.04597) この記事では、まずU-netの中で行われている処理についてを1〜4章でまとめ、それらの組

記事詳細
画像セグメンテーションのためのU-net概要紹介
ニューラルネットワーク 機械学習 画像認識
非エンジニアに説明するための「画像認識とは」と4つの活用事例

現在、多くの業界でAI・機械学習の重要性が増加しています。 背景のひとつに労働人口の減少による人手不足があります。帝国データバンクの調査によると、「正社員不足」状態の企業は全体の50.3%を占めています。 人手不足も解消のためには、業務自体を削減すること、または業務を人から代替する必要があります。 ここでは人間の目の代わりとなり、判断をおこなう機械学習である画像認識技術を紹介します。 スタンフォード大の研究者らがAI関連の研究開発や経済、教育、各国の動向な

記事詳細
非エンジニアに説明するための「画像認識とは」と4つの活用事例
利用事例 機械学習 画像認識
【機械学習入門】Pythonで実装する時の第一歩(気象データで天気予測)

はじめに 最近天気が不安定で、急な雨が多くまいっています。(しかも冬の雨はツライ。) ついつい出かける時に傘を持たずに、夜、雨に降られることも多いですよね。 現在、Pythonを使った機械学習を勉強しているので、kaggleだけではなく、実際にテーマを決めて何か簡単な実装をしてみたいと思い、今回は気象庁のデータを使って ある日に雨が降っている or いないという2値の予測を実装をします。 自分で作ると愛着が湧いて、ちょくちょく予測して傘を忘れずに済むだろう

記事詳細
【機械学習入門】Pythonで実装する時の第一歩(気象データで天気予測)
利用事例 機械学習
Deep Learningに関するテクニック(parameter update)

はじめに ニューラルネットワークの学習の目的は、損失関数( loss function )の値をできるだけ小さくするようなパラメータを見つけることに他ならない。これは言い換えれば最適なパラメータを決定するという点で最適化問題に帰着されるが、ニューラルネットワークの最適化はそのパラメータの数の多さから大変複雑な問題として扱われる。 今回はSGD, Momentum, AdaGrad, Adamと呼ばれる4つのパラメータ更新手法を紹介し、最後にMNISTデータ

記事詳細
Deep Learningに関するテクニック(parameter update)
ニューラルネットワーク 機械学習
マーケティングに使われるクラスタリング分析k-meansクラスタリング編-

はじめに クラスタリングはマーケティング手法としても使われている。 見込み顧客へ適切な施策を行うために、似た顧客同士をカテゴリ分けする必要があり、それをセグメンテーションという。 セグメンテーションのために機械学習の手法としてクラスタリングが使用されている。 k-meansクラスタリング(以下、k-means法)は複数個のデータをcentroids(重点)からの距離に応じて、あらかじめ決めたk個のクラスタに分ける非階層クラスタリング、及び、ハードクラスタリ

記事詳細
マーケティングに使われるクラスタリング分析k-meansクラスタリング編-
クラスタリング 機械学習
【論文】

Attention は "Attention is all you need" (Vaswani et al, 2017)で一躍有名になった手法ですが、実はこの論文の前からあった概念です。今回はこのAttentionの技術について、またこの論文について解説していきたいと思います。 1 Attentionの概念 Attentionとは、「注意」とあるように、画像や文章の特定の部分に注意を向けるよう、学習させていく方法です。人間の場合を考えてみましょう。私たち

記事詳細
【論文】"Attention is all you need"の解説
機械学習 論文解説
最初に学ぶ クラスタリングの特徴と種類

クラスタリングとは  クラスタリングとは、異なる性質を持った多くのデータから類似性を見て自動的に分類する、機械学習の教師なし学習における手法のこと。(複数のコンピュータを連動させることにより、1台のコンピュータとして利用できるようにする技術を言うこともある)  マーケティングでは、顧客層の特性分析や店舗取り扱い商品の構成分析に利用されており、多くの顧客や商品を分類し、どのような顧客が多いのかを明確にし、ターゲットを決定する。  クラスタリングとクラス分類は

記事詳細
最初に学ぶ クラスタリングの特徴と種類
クラスタリング 機械学習
最初に学ぶ ニューラルネットワークの特徴と利用例

ニューラルネットワークとは  ニューラルネットワークとはAI (人工知能)のうちの一つ。また、AIの一つである機械学習のうちの一つでもある。(図1)また、人間の脳内にある神経細胞(ニューロン)とそのつながり、つまり神経回路網を数理モデル化したもの。(図2) (図1)  ニューラルネットワークを構成している最小単位は、パーセプトロン(単純パーセプトロン)という。パーセプトロンとは、複数の入力に対して1つの値を出力する関数のこと。パーセプトロンへの入力値を(X

記事詳細
最初に学ぶ ニューラルネットワークの特徴と利用例
ニューラルネットワーク 機械学習
単回帰分析における最小二乗法の解説

回帰分析とは 先ず回帰分析とは、あるp個の変数が与えられた時、それと相関関係のあるyの値を説明、予測することである。ここで変数xを 説明変数 、変数yを 目的変数と呼ぶ。p=1、つまり説明変数が1つの時を単回帰、またp>=2、つまり説明変数が2つ以上の時を重回帰と呼ぶ。 単回帰分析 今回はp=1と置いた 単回帰分析 について説明する。 このとき、回帰式は y=ax+b(a,bは 回帰係数 と呼ばれる)となり直線の形でyの値を近似(予測)できる。 単回帰分析

記事詳細
単回帰分析における最小二乗法の解説
回帰 機械学習
RNNとLSTM(Long Short Term Memory)の違いと特徴

LSTM(Long Short Term Memory)は音声認識など、様々な場面で使われるモデルなのですが、意外と歴史のあるモデルでもあります。今はattention等に押されている感はありますが、通常のRNNを大きく改善したと呼ばれる、学ぶ価値のあるモデルです。ここでは、RNNとの違い、実際の仕組みを解説していきたいと思います。 1 RNN LSTMはRNNの一種ですが、通常のRNNが情報をそのまま次に引き継ぐのに対し、LSTMでは中間層を噛ませて次に

記事詳細
RNNとLSTM(Long Short Term Memory)の違いと特徴
ニューラルネットワーク 機械学習
Microsoft Azure Machine Learningで決定木アルゴリズムCARTを用いた性能評価

ここでは今は去りしデータマイニングブームで頻繁に活用されていた決定木について説明する。理論的な側面もするが、概念は理解しやすい部類であるので参考にしていただければと思う。 1 決定木(Decision Tree) 決定木とは木構造を用いて分類や回帰を行う機械学習の手法の一つで段階的にある事項のデータを分析、分離することで、目標値に関する推定結果を返すという方式である。データが木構造のように分岐している出力結果の様子から「決定木」との由来である。用途としては

記事詳細
Microsoft Azure Machine Learningで決定木アルゴリズムCARTを用いた性能評価
Azure Machine Learning 機械学習
Microsoft Azure Machine Learning でロジスティクス回帰を用いた Iris Two Class Dataの分類

はじめに  今回はロジスティック回帰についてやっていこうと思います。まずはロジスティック回帰の概要を説明して、最後には実際にAzureでiris(アヤメ)のデータでロジスティック回帰を使っていこうと思います。 勾配降下法  ロジスティック回帰でパラメータの値を決めるときに勾配降下法を用いるので、簡単に説明をしておきます。  勾配降下法は、ある関数J(w)が最小となるwを求める際に、あるwでの傾き(勾配)を求めて、降下の方向(傾きが小さくなる方)にwを更新し

記事詳細
Microsoft Azure Machine Learning でロジスティクス回帰を用いた Iris Two Class Dataの分類
Azure Machine Learning 回帰 機械学習
最初に学ぶ 2分類SVMモデルの基本

はじめに  今回は2分類SVMについて見ていきますが、数学や機械学習の知識があまりない方も全体のイメージを掴めるよう数式を使うことを極力避けました。ですので厳密には間違っている表記もイメージしやすいよう、わざと入れていることを始めに断っておきます。 SVMを数式を追ってしっかりと理解したいという方には物足りない内容になっていると思いますがご了承ください。 SVMとは  SVMとは、教師あり学習を用いるパターン認識モデルの一つで、回帰、分類両方につかうことが

記事詳細
最初に学ぶ 2分類SVMモデルの基本
回帰 機械学習
Microsoft Azure Machine Learning で分位点回帰を用いた飛行機遅延予測

分位点回帰は、普通の直線回帰とは少し変わった、特殊な回帰ですが、正規分布に従わないデータを処理する際、柔軟な予測をすることができる便利なモデルです。今回は、理論編・実践編に分けて、分位点回帰を解説していきたいと思います。 理論編 1.回帰 回帰とはデータ処理の方法の一つで、簡単に言うとデータを予測するモデルを作る際に、「モデル化=簡略化」に伴う損失を最小限にすることです。そしてこの「損失」を定量化するためにモデルごとに様々な「損失関数」を定義します。「損失

記事詳細
Microsoft Azure Machine Learning で分位点回帰を用いた飛行機遅延予測
Azure Machine Learning 回帰 機械学習
Microsoft Azure Machine Learning でランダムフォレスト回帰を用いた人気ブログタイトル予測

様々な場面で使われるランダムフォレストですが、大きく分けると「ランダム」の部分と「フォレスト=森」の部分の2つに分けることができます。そこで今回は理論編でそれぞれの部分がどういう仕組みになっているのか、解説していきたいと思います。後半では、実践編と題して、実際のデータセットとMicrosoft Azureを用いてRandom Forest Regressionを一般的なLinear Regression (直線回帰) と比べてみたいと思います。 理論編 0

記事詳細
Microsoft Azure Machine Learning でランダムフォレスト回帰を用いた人気ブログタイトル予測
Azure Machine Learning 機械学習

お問い合わせはこちらから