@Blog{zip358.com}
日常日誌からプログラムやYOUTUBER紹介、旅日記まで日々更新中です。
手前味噌な機械学習!?。
2020.09.01
分類分けで機械学習教師ありのモデルを作り、新たなデータで推測するという一連の過程をやってみたよーーー?
ちなみに分類分けとしてはあまり機能していないだけどね・・・。
何が難しかったか・・・Pythonをサーバで動かすようにするところと・・・何故かすんなり動いてくれなかった。そして機械学習させるデータを作るのがやはり面倒だった、途中から分類分けって感じじゃなく1分類という感覚で重み付けしました。
尚、サンプルとして表示しているのは、機械学習させてモデルを保存させるやつです。この他にもいろいろなファイルがあるのだけど、例えばデータを生成させたりする処理ファイルや保存したモデルから推測させる処理ファイルなどいろいろなファイルがあるのだけど、全て解説するのはちょっと面倒なので今回はこれだけです。
あと質問箱と連携するのは今後の質問によって決めようと思います。いちおう、ほぼその部分も完成しています。コードを手直してそれぞれをファイル連携してゴニョゴニョするという作業が残っています。
追記:きっちり分類分けしてそのデータをansの中に正解解答としていれてあげて学習させるとまぁまぁ良い感じです。
from sklearn.linear_model import LinearRegression
model = LinearRegression()
import pandas as pd
from sklearn.tree import DecisionTreeClassifier
import pickle
X = pd.read_csv("Question.csv", header=None).values.tolist()
ans = []
val = 0
for num1 in range(len(X)):
for num2 in range(len(X[num1])):
if float(X[num1][num2])>=0.5:
val = val + 1
val = float(float(val) / float(len(X)) * 100)
ans.append(str(val))
val = 0
model = DecisionTreeClassifier(max_depth=999)
model.fit(X,ans)
print(ans,"<==>",model.predict(X))
# モデルを保存する
filename = 'Q_model.sav'
pickle.dump(model, open(filename, 'wb'))
著者名 @taoka_toshiaki
※この記事は著者が40代前半に書いたものです.
Profile
高知県在住の@taoka_toshiakiです、記事を読んで頂きありがとうございます.
数十年前から息を吸うように日々記事を書いてます.たまに休んだりする日もありますがほぼ毎日投稿を心掛けています😅.
SNSも使っています、フォロー、いいね、シェア宜しくお願い致します🙇.
SNS::@taoka_toshiaki
タグ
1, Python, あと, いろいろ, コード, これだけ, サーバ, サンプル, それぞれ, データ, ところ, ファイル, モデル, やつ, 一連, 今回, 今後, 他, 何, 保存, 全て, 処理, 分け, 分類, 学習, 完成, 感覚, 手前味噌, 手直, 推測, 教師, 機械, 機能, 生成, 表示, 解説, 質問, 途中, 連携, 過程, 部分, 重み, 面倒,
ブログが続く人、続かない人の訳(´∀`)、SEOとかそんなの置いとけ。Part2
2015.01.29
?昨日の続き、ブログが続く人はだいたい自分の好きな分野で書いていることが多いです。自分ではパソコンヲタクではないと思っているだけで、たぶん、はたから見ればかなり、パソコンやプログラムに関してはマニアックなところまで知っているだと思います。
一般市民から見ればヲタクの分類分けされるだろうと思いますが、自分ではフィギュアとか持ってないし美少女アニメとか見ないしガンダムも知らない系なのでヲタクの分類分けをすると省かれるところに居座っているとは思っているですけど・・・
でも一般市民からすればヲタクなんだろうと。
ちなみに何故かこの分野の人って結構、ガンダムをこよなく愛する人が多いです。たぶん世代を通して話せる話題なんでしょうね、ある意味、共通言語みたいなものになっています。話し戻しまして基本的に好きな分野を掘り下げていくとネタにもなり自分の知識アップや能力向上にも繋がるので、そういう分野で記事を書くことをオススメします。
SEOの話になりますが何の記事で書けばよいか?、いちばん、おすすめは誰も敵がいない分野で書くことです。自分みたいにIT関係や映画のレビュー系だと敵が結構多いですね。ある意味、激戦なのでグーグルに記事を拾ってもらうのも結構シビアです。誰も書いていなく誰一人として土俵に上がっていない分野が一番有利です。
あと本屋さんに行けばSEOの参考の本などが並んでいると思いますが、はっきり言って役に立たないです(みんながやっていることですから)、じゃ何を参考にすればよいのかといえばWEBマーケティングの本だったりします。この本に書かれている内容は基本的にネットでどう立ち振る舞えば集約が多くなるのかといった話です。俗にいうネット上の営業です。
自分が気おつけている事ですが、記事の内容が少ないと拾ってもらえませんが、あまりSEOを意識しないことです。そこだけがポイントであとは地道な日々の積み重ねです。もうひとつ言うと、SNSと連携していなければ大体、初期のアクセス数はひと桁台です、それが一年間ずっと続いたりします。それでも日々の蓄積は大事です、いつ芽が出るか分からないからです。自分の場合、ある過去記事が、テレビで放送された後、検索ワードとリンクしてアクセス数がいきなり増えた経験があります。グーグルさんは新しい記事よりも古い記事のほうが信頼性が高いと判断しやすいです。なので未来に起こることを先読みすればアクセス数は増えるですけどね・・・・。
そんな未来予測は誰も出来ません・・・・未来予測はできないけれど大きなイベント等は予定に組み込まれていますし、テレビ番組は一週間先ぐらいまで予定として組み込まれています、なので全然、未来予測ができないわけでもないのです、トイウコトデ、そこが二つ目のポイントです、そういう事を念頭に置いて書くと、運が良ければ検索で上位に並ぶ可能性があります。
検索話のうんちく…、ユーザーは4つぐらいの方法でブログなどを閲覧しに来ます。
1つ目は検索よる訪問、2つ目はSNSよる訪問、3つ目は紙媒体の広告やメディアからの訪問、4つ目は他のページからリンクよる訪問、この4つだと自分は思っています。その中で検索が未だに重要なポイントを占めています。そしてこの検索が徐々に賢くなってきていて、今では、検索する場所や地域などにも関係してきています(もう過去形)。それがもっと賢くなってきていて今では位置情報を割り出して検索ヒットの順番を変えてたり、位置情報や時間帯からユーザーのニーズに答えるものになっていますし、検索アカウントログイン有無関係なしで検索過去履歴や時間帯なども考慮して検索結果を表示しています。また検索ワードが同じでも、時間を置いてから検索すると表示順序が変わってたりします。この検索の技術向上に裏には人工知能とビックデータが存在します。今後、この技術はますます向上していくと思いますので、これからは検索のことを考えるよりも、いかにすればユーザーが満足してくれるかを考えたほうが良いと自分は思っています。逆に言えばSNSユーザーに焦点を当てたWEBマーケティングを行ったほうが良さそうです。
?
著者名 @taoka_toshiaki
※この記事は著者が30代前半に書いたものです.
Profile
高知県在住の@taoka_toshiakiです、記事を読んで頂きありがとうございます.
数十年前から息を吸うように日々記事を書いてます.たまに休んだりする日もありますがほぼ毎日投稿を心掛けています😅.
SNSも使っています、フォロー、いいね、シェア宜しくお願い致します🙇.
SNS::@taoka_toshiaki
タグ
2, Part, SEO, アップ, アニメ, かなり, ガンダム, こと, ところ, ネタ, パソコン, はた, フィギュア, ブログ, プログラム, マニアック, もの, ヲタク, 一般, 世代, 人, 人はだ, 共通, 分け, 分野, 分類, 向上, 市民, 意味, 昨日, 書, 知識, 系, 美少女, 能力, 自分, 言語, 記事, 訳, 話題,