R
Rで二次元配列(行列)データに、 行を追加するならrbind、 列を追加するならcbindですが、 三次元以上の多次元配列にデータを追加するには・・・? そう、abindを使えば、 多次元配列でも好きな次元にデータを追加できますね。 機械学習で画像を入力する場…
クラスタリングではクラスタ数を事前に与えることが多いのですが、 クラスタ数も自動的に推定してしまうのがディリクレ過程混合モデルです。 ディリクレ過程混合モデルを動かそうと思うと、 モデル式を書いて、MCMCで数値計算するのがシンプルな方法ですが、…
補色とは、 「色相環の反対側にある色」、 「混ぜると無彩色になる色」 などの特徴で説明されることが多いのですが、 その物理的な性質はどのようなものでしょうか。 ここでは、補色の物理的な意味を、 光のスペクトルとの関係から紐解いていきましょう。 色…
ブログを再訪問してくれるリピーターは、 少なくともブログの内容に関心を持ってくれているはずです。 たまたま同じブログにアクセスしてしまった人もいるでしょうが、 この広いインターネットの世界でそれは稀でしょう。 ブログの内容が何か響いたからこそ…
検索からのアクセスはブログの主な集客経路ですが、 当然、同じキーワードで検索される別のサイトと アクセスを取り合うことになります。 自分のブログが外から見てどういうブログなのかは、 どういう記事を書いているかだけではなく、 競合するサイトの中で…
投資では、投資先を分散させることによって、 リスクを下げる戦略がよくとられます。 投資先とは何も銘柄のようにモノに限ったものではなく、 時間的に分散するという戦略も取ることができます。 金融商品にも、定期的に積み立てていくような 時間的に分けて…
ブログを書くからには、 読んだ人の役に立ちたいと思うのは、 当然だと思います。 とは言え、読み物は読む相手の顔が見えないので、 どんな人が読んでくれているか分からず、 どう工夫すれば良いのかを考える取っ掛かりに欠けがちです。 マーケティングの分…
特定のテーマに絞らないブログを書いていると、 ブログの強みが見えずらくなります。 それは、ブログを読んでくれる方ももちろんですが、 書いている本人ですら、自分のブログの強みが分からなくてなりがちです。 強みを認識することで、 この先さらにその強…
地域経済分析システム(RESAS)とは、 地域ごとの産業構造、人口、人の流れなどのデータを、 収集・可視化するシステムで、政府によって提供されています。 可視化に用いられているデータを API を通じて取得することもでき、 これが今回用いる RESAS-API で…
Rでプログラミングを行うとき、 便利な統合開発環境を提供してくれるのがRstudioです。 Rstudioではグラフの描画とコーディングを同じウィンドウ内で完結でき、 コード打ちと結果の確認がシームレスに行えて非常に捗ります。 そんなRstudioをサーバーサイド…
前回、以下の記事で Google Seach Console からの検索クエリの情報を、 Google データポータルを使ってバブルチャート化する方法を紹介しました。 clean-copy-of-onenote.hatenablog.com Googleデータポータルでは、数値を色で表すことができないので、 縦軸…
遺伝子の優性・劣性という言葉を聞いたことがあると思います。 2年ほど前には、日本遺伝子学会が言葉の誤解を避けるために、 優性・劣性の代わりに顕性・潜性という言葉を使うように提言したのも、 記憶に新しいところです。 優性・劣性とは、簡単に言ってし…
Windowsではユーザー名に日本語を利用することができます。 その場合、ホームディレクトリは日本語の名前になるのですが、 これが厄介な問題を起こすことがあります。 プログラミングに慣れていると、 ファイルパスに日本語が含まれているとエラーが出ること…
代表的な公開鍵暗号であるRSA暗号ですが、 暗号化や復号化の手順自体はかなり簡単で、 プログラムの実装もそこまで苦労することなくできます。 clean-copy-of-onenote.hatenablog.com ということで、Rで実際にRSA暗号のコードを書いて、 暗号化や復号化を動…
R はライブラリも充実していて非常に便利ですが、 他の言語に比べて処理が遅いという印象があります。 処理が遅いと言っても、 プログラムの書き方によってかなり処理時間が変わってくるので、 いわゆるRのお作法のようなものを抑えておけば、 気にならない…
R でコードを書くときに便利なのが RStudio です。 RStudio では、コード、コンソール、変数、グラフを 一つのウィンドウに配置して表示してくれて、 画面の切り替えなしに、 コードも書けて、結果も見れるので作業が捗ります。 ところが、そんな RStudio の…
ディープラーニングのライブラリ keras では、 MNIST という数字の手書き文字のデータセットが 用意されています。 ところが、数字なので、10種類しかなく、 沢山の種類のデータを使いたいという場合には不便です。 手書き文字のデータセットとして、 MNIST…
R ではkeras パッケージを利用することで、 簡単にディープラーニングを動かすことができます。 clean-copy-of-onenote.hatenablog.com また、この keras では、インストール時に GPU 利用を指定することで、 GPU でのディープラーニングを簡単に実行するこ…
R から YouTube のAPIを利用するのに便利なパッケージが「tuber」です。 これを使うと、動画投稿を自動化したり、 サムネイル画像の設定を自動化することができます。 clean-copy-of-onenote.hatenablog.com 動画投稿の際には、 動画のテーマに応じて、 別々…
YouTube に動画を投稿する場合、 ほぼ必ず設定するのがサムネイルです。 通常であれば、手動で動画の投稿、 サムネイルの設定を行いますが、 これがすべてプログラムで自動でできると、 なにかと捗ります。 YouTube では API が提供されていて、 これを利用…
ディープラーニングの中で、大きく注目を浴びているのが、 敵対的生成ネットワーク、いわゆる GAN です。 これは、学習の仕方を工夫したもので、 二つの人工知能が互いに競い合って、 学習を進めていくようになっています。 通常、学習結果をよくしようと思…
動画にナレーションを入れる時に便利なのが、 音声合成の技術です。 文章を入力すると、それを読み上げたかのような 音声を生成してくれるというものですね。 音声合成ソフトには無料のものも多くありますが、 ここでは、Amazon が提供している 有料の音声合…
ある薬の効き目を調べたいと思った時に、 薬が投与された人と薬が投与されていない人の状態を比べるというのは、 自然なことですよね。 ところが注意しないといけないのは、この場合だと、 薬を投与する人を偏りなく選ばなければならないということです。 も…
Google Analytics では、複数のサイトを登録して、 それぞれのサイトのアクセス分析をすることができます。 ところが、運営するサイトが増えてくると、 いちいち切り替えてみるのが面倒になってきますし、 こっちのサイトとあっちのサイトを比べたいという時…
ディープラーニングで時系列を扱うとなると、 定番なのはLSTM(Long Short Term Memory)と呼ばれるモデルです。 LSTMでは、時間的な関係をニューロンの構造に組み込んだもので、 データに時間の流れなどが含まれる場合に、適したモデルとなります。 今回は、…
ディープラーニングが当たり前の技術になりつつある昨今ですが、 未だにディープラーニングを動かしてみたことのない私です。 一回は触っておかないといけないなと思いつつも、 触るだけのモチベーションで、環境整えるのも面倒でしょ? と言い訳して避けて…
Amazon では商品の検索、商品の詳細情報を API で提供しています。 欲しい情報を指定した URL クエリを投げると、 xml 形式で情報を返してくれます。 この API は https による通信にも対応しているのですが、 クエリを作る際に電子署名を付けるなど、 少々…
R Markdown で作成した HTML ファイルを、 直接 WordPress に投稿することができる「RWordPress」というパッケージですが、 何故か固定ページを編集する機能が容易されていません。。。 仕方がないので、 新しい関数を追加して、 固定ページを編集する機能を…
「RMongo」パッケージを使って、 mongoDBのデータを触っている時に、 ObjectID でデータを参照して操作する方法が分かるまでに時間がかかってしまったので、 まとめておきます。 やりたい操作 ObjectID で指定する場合は、oid データとして指定する 文字列か…
最近のテレビは録画機能が充実していて、 指定したキーワードで勝手に録画をためこんでくれます。 私が使っている「ビエラ」さんには、 2TBの外付けハードディスクを付けていて、 200時間ほどの録画ができるのですが、 気づくと一杯になってしまいます。 困…