日本語に特化したOCR、文書画像解析Pythonパッケージ「YomiToku」でとさでん時刻表を解析

2024.12.17

Logging

おはようございます.日本語に特化したOCR、文書画像解析Pythonパッケージ「YomiToku」でとさでん時刻表を解析出来るかやってみました.とさでん交通は未だに時刻表がPDFなのでとても見にくいのです、業者さんは提案しないのかな.

ちなみにとさでん交通さんとは高知県の路面電車になります.地元のために頑張ってる公共交通機関ですが過去には経営が厳しい時期もあったようです.今も大変は大変だと思います、高知県は基本的には公共交通機関を使用する人よりも車通勤が多いです、そして少子高齢社会が進んでいる県でもあるので.

そんな公共交通機関の時刻表PDF解析してHTML化してみようと機械学習のPythonライブラリ「YomiToku」を使用してみました、結果、なかなか精度は良いのですがHTML化された物をそのままでは使用できないので手直しが必要です.

恐らく普通のPDF表だったら、綺麗にHTML化出来ると思いますが、とさでん交通さんの時刻表が特殊過ぎるのでこういう結果になったのだと自分は結論付けました.

ちなみに巷では一回画像へ変換しないといけないなどと記載している記事を見かけますが、PDFファイルのまま、OCR解析出来ます.

自分はこんな感じのコマンドラインで実行しました.

yomitoku ./pdfs/akebono.pdf -f html -o output_html

明日へ続く

著者名  @taoka_toshiaki

※この記事は著者が40代前半に書いたものです.

Profile
高知県在住の@taoka_toshiakiです、記事を読んで頂きありがとうございます.
数十年前から息を吸うように日々記事を書いてます.たまに休んだりする日もありますがほぼ毎日投稿を心掛けています😅.
SNSも使っています、フォロー、いいね、シェア宜しくお願い致します🙇.
SNS::@taoka_toshiaki

OFUSEで応援を送る

タグ

コマンドライン, でん交通さん, ファイル, ライブラリ, 公共交通機関, 厳しい時期, 地元, 少子高齢社会, , 手直し, 文書画像解析パッケージ, 時刻表, 未だ, 機械学習, , 精度, 経営, 路面電車, 車通勤, 高知県,

Pythonでノイズキャンセリングアプリ化するコードです😤デスクトップアプリ

2024.12.14

Logging

おはようございます.昨日の続きを記載します、Pythonでデスクトップアプリを作りました、デスクトップにPythonが入っている環境で下記のファイルを実行することでノイズキャンセリングが出来ます.

尚、前手順でライブラリを2つインストールください.

pip install scipy noisereduce
import tkinter as tk
from tkinter import filedialog, messagebox
from scipy.io import wavfile
import noisereduce as nr
import os

def select_file():
    file_path = filedialog.askopenfilename(
        filetypes=[("WAV files", "*.wav")]
    )
    if file_path:
        file_entry.delete(0, tk.END)
        file_entry.insert(0, file_path)

def reduce_noise():
    file_path = file_entry.get()
    if not os.path.isfile(file_path):
        messagebox.showerror("エラー", "Please select a valid WAV file.")
        return

    try:
        # Load data
        rate, data = wavfile.read(file_path)
        
        # Perform noise reduction
        reduced_noise = nr.reduce_noise(y=data, sr=rate)

        # Save reduced noise file
        output_path = os.path.splitext(file_path)[0] + "_reduced_noise.wav"
        wavfile.write(output_path, rate, reduced_noise,stationary=True,prop_decrease=0.7)
        
        messagebox.showinfo("成功", f"出力先:\n{output_path}")
    except Exception as e:
        messagebox.showerror("Error", f"An error occurred: {e}")

# Create the main application window
root = tk.Tk()
root.title("ノイズキャンセリングツール")

# Input file selection
frame = tk.Frame(root)
frame.pack(pady=10, padx=10)

tk.Label(frame, text="Select a WAV file:").grid(row=0, column=0, pady=5, padx=5)
file_entry = tk.Entry(frame, width=40)
file_entry.grid(row=0, column=1, pady=5, padx=5)
select_button = tk.Button(frame, text="Browse", command=select_file)
select_button.grid(row=0, column=2, pady=5, padx=5)

# Noise reduction button
process_button = tk.Button(root, text="ノイズ除去", command=reduce_noise, bg="lightblue")
process_button.pack(pady=10)

# Run the application
root.mainloop()

因みにこのコードをパッケージ化したい場合はPythonの下記のライブラリをインストールするとパッケージ化が出来ます.

pip install pyinstaller
pyinstaller noise-cut.py

自分でもノイズキャンセリングを試してみましたが精度はいまいちでした、noisereduceの微調整が必要になりそうです.

明日へ続く

著者名  @taoka_toshiaki

※この記事は著者が40代前半に書いたものです.

Profile
高知県在住の@taoka_toshiakiです、記事を読んで頂きありがとうございます.
数十年前から息を吸うように日々記事を書いてます.たまに休んだりする日もありますがほぼ毎日投稿を心掛けています😅.
SNSも使っています、フォロー、いいね、シェア宜しくお願い致します🙇.
SNS::@taoka_toshiaki

OFUSEで応援を送る

タグ

エラー, コード, デスクトップ, デスクトップアプリ, ノイズキャンセリング, ノイズキャンセリングツール, ノイズ除去, パッケージ化, ファイル, ライブラリ, 下記, 出力先, 前手順, 微調整, 成功, 環境, 精度, 自分,

生成AI、正直、絵に関しては見分けがつかないレベルまで来ているパッと見分からないけど.

2024.09.24

Logging

おはようございます.生成AI、正直、絵に関しては見分けがつかないレベルまで来ているパッと見分からないけどよく見ると線が不自然な書き方があったり、微妙に歪みが絵にあるだけどそんなの多分、絵師さんしか分からない.

最近、自分の職業があと数十年で仕事を失うだろうという記事を読んで有り得るかもしれない?、でも実際そうならない気もする.理由は殆どの生成AIは有料じゃないと精度が良くないから、そして無料化して人々がコードを出力しだしても結局それを理解して使える人はあんまりいない.

コードを生成したりアプリを生成したりすることは出来るようになってきているけど、それは一から作られたアプリやホームページなど.そこからオリジナリティを出すためや自社製品としてカスタマイズするにはプログラマーが必要になる.これから一から製品を作ることが少なくなりAIが作ったものを手直しする事が増えそうな気がしてならない(当分はなさそうだけども).

あのノーコードアプリが登場したときも、これでプログラマーの職が消えると騒いでいたのに結局のところ、あまり変化がなかった.それに今の現状は酷似している😆.

因みにGさんが生成AIを浸透させるために無料化に舵を切ったけど使いこなせる人の割合は変わらないよね.たぶん.

明日へ続く.

著者名  @taoka_toshiaki

※この記事は著者が40代前半に書いたものです.

Profile
高知県在住の@taoka_toshiakiです、記事を読んで頂きありがとうございます.
数十年前から息を吸うように日々記事を書いてます.たまに休んだりする日もありますがほぼ毎日投稿を心掛けています😅.
SNSも使っています、フォロー、いいね、シェア宜しくお願い致します🙇.
SNS::@taoka_toshiaki

OFUSEで応援を送る

タグ

AI, オリジナリティ, コード, ノーコードアプリ, プログラマー, 人々, 割合, 変化, 有料, 正直, 殆ど, 現状, 生成AI, 精度, , 絵師さん, , 職業, 自社製品, ,

画像系生成AIはガチャ

2024.01.31

Logging

Gotcha は、英語のスラングで「わかった」「捕まえた」という意味です。日常会話でよく使われ、”I got you”を略したものです。

おはようございます、画像系生成AIはガチャです。何度も生成AIを行うと自分が想像していたものに近い絵柄を生成することができます。そうかと思うと数回の生成AIで良い結果が出たりとムラがあります。精度の良い画像系生成AI、例えばmidjourney(ミッドジャーニー)などは簡単なプロンプトで良い結果の画像が生成されますが、まだベータ版のIllustratorの画像生成AIだと全然、お目当ての画像には行き着きません、中々難しいです。

Illustratorの良い点は、ベクター画像で生成AIが出力されるところです。他の画像生成AIはpngやjpgなどで出力されるので、編集し難いところが問題になりますがIllustratorはそこらへんをカバーしていると思います。

でも画像生成AIで飛び抜けているのは前述の通りミッドジャーニーだと思います。これにベクター機能が付いたら向かうところ敵無しだと思います。

明日へ続く。

著者名  @taoka_toshiaki

※この記事は著者が40代前半に書いたものです.

Profile
高知県在住の@taoka_toshiakiです、記事を読んで頂きありがとうございます.
数十年前から息を吸うように日々記事を書いてます.たまに休んだりする日もありますがほぼ毎日投稿を心掛けています😅.
SNSも使っています、フォロー、いいね、シェア宜しくお願い致します🙇.
SNS::@taoka_toshiaki

OFUSEで応援を送る

タグ

Gotcha, I got you, illustrator, jpg, Midjourney, png, スラング, そこらへん, プロンプト, ベータ版, ベクター機能, ベクター画像, ミッドジャーニー, むら, 前述, 生成AI, 画像生成AI, 精度, 近い絵柄, 通りミッドジャーニー,

イラレの生成AIはプロンプト次第です。

2023.11.08

Logging

おはようございます、イラレの生成AIはプロンプト次第です。自分の肌感ではみんながよく使いそうなキーワードを使用すればそれなりのイラストやロゴが生成出来るのだけど、例えば自分の名前を入れたロゴを作ってみたいなのには、まだ応用が効かなく良いデザインが生成されないことが多いです。

ですが、ポリゴンとかそういうキーワードを盛り込むだけでまぁまぁ良いデザインが何度かの作業で生成されます。あと、生成されたデザインの色も生成AIで変更可能になっている。

要は使いようで良いデザインも劣化したデザインにもなるので、まずは短めの単語で生成して使用してみてください。その方が精度の良いデザインが生成されるはずです。

因みに下記には生成AIで作ったデザインが含まれています。

明日へ続く。

著者名  @taoka_toshiaki

※この記事は著者が40代前半に書いたものです.

Profile
高知県在住の@taoka_toshiakiです、記事を読んで頂きありがとうございます.
数十年前から息を吸うように日々記事を書いてます.たまに休んだりする日もありますがほぼ毎日投稿を心掛けています😅.
SNSも使っています、フォロー、いいね、シェア宜しくお願い致します🙇.
SNS::@taoka_toshiaki

OFUSEで応援を送る

タグ

イラスト, イラレ, キーワード, デザイン, プロンプト次第, ポリゴン, みんな, ロゴ, 下記, 作業, 使いよう, 単語, 名前, 応用, 生成AI, 短め, 精度, 肌感, 良いデザイン, ,

Photo by Pixabay on Pexels.com

機械学習でオススメ記事を作ってみる。

2023.10.24

Logging

おはようございます、機械学習でオススメ記事を作ってみる。仕組みはこんな感じです😄。

  • 記事から同じ傾向の記事を取得する。
  • 記事のMeCabを使用して分割。分離したものを機械学習に投入。
  • 出来上がったモデルから似ている傾向の記事を抽出。
  • 新規記事を投稿した場合、再学習させモデルに追加。

上記の流れをCHATGPTに投げ込んでコードを生成してもらい、そのコードを再修正してAPI化したものを仕事終わりに週末作ろうと思っています。出来ればそれを元に自分だけしか使えないプラグインにしてWordPressに取り組むつもりでいます。

これでどれぐらいの精度がでるのかは、やってみないと分かりませんが試す価値はあるかなって思っています。あと、作りたいのはクリックしたものを機械学習させて何か出来たら良いなって思っています、また、記事学習モデルから、チャット形式でこんな記事はどうですかってオススメする物を作りたいですね。

明日へ続く。

著者名  @taoka_toshiaki

※この記事は著者が40代前半に書いたものです.

Profile
高知県在住の@taoka_toshiakiです、記事を読んで頂きありがとうございます.
数十年前から息を吸うように日々記事を書いてます.たまに休んだりする日もありますがほぼ毎日投稿を心掛けています😅.
SNSも使っています、フォロー、いいね、シェア宜しくお願い致します🙇.
SNS::@taoka_toshiaki

OFUSEで応援を送る

タグ

API化, ChatGPT, Mecab, WordPress, コード, チャット形式, プラグイン, モデル, 仕事終わり, 価値, 傾向, , 分割, 投入, 抽出, 機械, 機械学習, 精度, 記事学習モデル, 週末,

Gさんラボで生成AI使用しているけど結論から

2023.09.04

Logging

おはようございます、Gさんラボで生成AI使用しているけど結論から言えば自分のサイトには影響を受けないじゃないのかなって思ったりしています。多少はアクセス数が減少するかも知れないけど、やはり激減しそうにない。自分のサイトにアクセスしているのは、ニッチなファン層を除きたまたま、見に来た人が多いのでそんなに生成AIサーチによりアクセス数が激減しないと見ています。

ちなみにGさんの生成AIを使用したい方はこちらのブログのなかにあるリンクをクリックすると、リリース前に生成AIと検索サービスの融合がどんなものなのか分かります。自分はOpenAIよりGさんのBard推しなのです。ちなみに今の精度ではOpenAIが若干勝っている気がしますが、ChatGPTがたまにご機嫌斜めでレスポンスが遅い時があります。そういう面、GさんのBardはいつもレスポンスは早いですね。

なので、後出しジャンケンで恐らくGさんに軍配が上がり、OpenAIはマイクロソフトに買収されるじゃないかなって思っています。

著者名  @taoka_toshiaki

※この記事は著者が40代前半に書いたものです.

Profile
高知県在住の@taoka_toshiakiです、記事を読んで頂きありがとうございます.
数十年前から息を吸うように日々記事を書いてます.たまに休んだりする日もありますがほぼ毎日投稿を心掛けています😅.
SNSも使っています、フォロー、いいね、シェア宜しくお願い致します🙇.
SNS::@taoka_toshiaki

OFUSEで応援を送る

タグ

Bard, ChatGPT, Gさん, Gさんラボ, OpenAI, ジャンケン, なか, ファン層, マイクロソフト, レスポンス, 多少, 生成AI, 生成AIサーチ, 精度, 結論, 若干, 融合, 軍配, 遅い時, ,

昨日まで英語の記事でした。実験的な何か?。

2023.06.24

Logging

おはようございます。昨日まで英語の記事でした。実験的な何かです?

chatGPTに日本語記事を英語の記事にしてもらいました。来週の水曜日にchatGPTを使用したワードプレスでプラグインを公開します。2つほどプラグインを作ります。1つ目は日本語記事をプラグインで英語に変換するプラグインです。もう一つはちょっと問題作なのでアルゴリズムとソースコードを公開します。

これからchatGPTのAPIを活用したプラグインが続々と世に出ていくと思いますが、やはりchatGPTはテキストの相性抜群だと思います。因みにワードプレスのプラグインのソースコードを書いてと問い合わせを行えばソースコードの例文を書いてくれますが、これがちゃんと動くかどうかは微妙ですね。

chatGPTはたまに間違った返答を書きます、なんだか人を試しているかのように。それを見抜く力がないと大変です。なのでchatGPTを使用するには一定量の知識が必要になりますし検証は大事です。今の機械学習の精度は問い合わせにより解答の精度が違いますので、知識量が多いと上手く解答を導き出すことが出来るかと思います。

著者名  @taoka_toshiaki

※この記事は著者が40代前半に書いたものです.

Profile
高知県在住の@taoka_toshiakiです、記事を読んで頂きありがとうございます.
数十年前から息を吸うように日々記事を書いてます.たまに休んだりする日もありますがほぼ毎日投稿を心掛けています😅.
SNSも使っています、フォロー、いいね、シェア宜しくお願い致します🙇.
SNS::@taoka_toshiaki

OFUSEで応援を送る

タグ

API, ChatGPT, アルゴリズム, ソースコード, テキスト, プラグイン, ワードプレス, 一定量, 例文, 問題作, 検証, 機械学習, 水曜日, 相性, 知識, 知識量, 精度, 英語, 解答, 返答,

Gさんが提供するVertex AI VisionAIを使用してみて。

2023.04.04

Logging

おはようございます。Vision AIで画像解析の精度を試しみた結果、これで良いかなと思い始めています。これを使用して「釣ったー」という釣り画像をシェアするサイトを作ろうかなって思っています。問題だったのが魚が写っている写真なのかを判別することが問題になっていました。当初はtensorflowで提供されている学習済みのモデルを使用したJSライブラリを使用して画像の判別しようと思っていたのですが、これ少し難がありモデルの精度がいまいちな所があります。

サービス提供する側としては、あまり変な画像をUPされるとその対応に時間を費やさないといけないので、そこは避けたい所があります。文章での誹謗中傷は現在、誹謗中傷に特化したデータを自分がもっているので、その方法を使用することである程度、投稿の判別は可能になっていましたが、前文で書いた通り画像の判別は難です。

今から魚のデータセットを取り入れたとしても、学習させるPCが存在しない。いつも使用しているPCでは、学習させることは可能だけどさて、どのぐらい時間を費やさないといけないのかなどの問題があるので断念。旧PCはあるにはあるのだけど機械学習させるスペックではないので断念した。

そのため機械学習モデル済みのモデルが必要になった。モデルを探すより、学習済みのAPIを使うのが手っ取り早いと思ったので、AWS、Azure、GCPという候補の中でざっくり考えた結果。

GCPに軍配が上がって、試してみた結果。良好だったのでそちらを使用することにした。

尚、VisualAPIを使用するにあたって参考にしたサイト。環境変数などの設定などは如何なものかと思ったのでそこは参考にしていない🙄。

https://www.asobou.co.jp/blog/web/vision-api

https://packagist.org/packages/google/cloud-vision

注意事項として画像をひとつ添付する。左の項目最下のマーケットプライスの中にVertex AI VisionAIが組み込まれているので、それを有効にすること。後は上記のリンクを参考にすると上手く出来ると思います。

著者名  @taoka_toshiaki

※この記事は著者が40代前半に書いたものです.

Profile
高知県在住の@taoka_toshiakiです、記事を読んで頂きありがとうございます.
数十年前から息を吸うように日々記事を書いてます.たまに休んだりする日もありますがほぼ毎日投稿を心掛けています😅.
SNSも使っています、フォロー、いいね、シェア宜しくお願い致します🙇.
SNS::@taoka_toshiaki

OFUSEで応援を送る

タグ

AI VisionAI, API, AWS, Azure, GCP, JSライブラリ, tensorflow, Vertex, VisualAPI, スペック, マーケットプライス, , 判別, 前文, 断念, 環境変数, 精度, 誹謗中傷, 軍配, ,

Photo by Flo Dahm on Pexels.com

人工知能の知能は指数関数的にだけど、人が追いつていない。

2023.04.01

Logging

おはようございます。この頃、ネットでもテレビでも人工知能を取り上げない事がないぐらい、人工知能の話題に持ちきりですが、さてどれぐらいの人が人工知能の良さを理解してそれを仕事なりに活用していっているのだろうか?、自分が思うに大半の方は人工知能の力を借りずに今まで通りタスクを熟しているのではないだろうかと。

AIによる「大規模言語モデル(LLM)」の最新潮流~Shane Gu×スプツニ子!×松尾豊×山田敦×上野山勝也

大規模言語モデルで、精度も良いのはchatGPTだけではない。RWKV 14B Alpacaとかも良さげです。

AI魂. また出ちゃった! RWKV 14B Alpacaファインチューニング版を試す!

これ・・・無料なんですよね。すごいな精度もまぁまぁ良さそうです。人工知能は週単位で進化していくのだけど、人ってそんなに週単位で賢くならないので確実に人より人工知能が賢くなりそうな気がしますが・・・・。人工知能が賢すぎると人工知能が言っていることを人が理解出来なくなるという問題と人が制御出来なくなる問題が生まれそう。正直なところ、今ぐらいの賢さで留めておいた方が良い気がします。映画、トランテンデンス(超越)が本気で起こるかもしれないからね笑。

映画『トランセンデンス』予告編

著者名  @taoka_toshiaki

※この記事は著者が40代前半に書いたものです.

Profile
高知県在住の@taoka_toshiakiです、記事を読んで頂きありがとうございます.
数十年前から息を吸うように日々記事を書いてます.たまに休んだりする日もありますがほぼ毎日投稿を心掛けています😅.
SNSも使っています、フォロー、いいね、シェア宜しくお願い致します🙇.
SNS::@taoka_toshiaki

OFUSEで応援を送る

タグ

Alpaca, ChatGPT, RWKV, テレビ, トランテンデンス, ネット, 人工知能, 仕事, , 問題, 大半, 映画, , 精度, , 言語モデル, 話題, 超越, 通りタスク, 週単位,

既存のYOUTUBERも飽きてきた。 #マンネリ

2023.01.23

Logging

おはようございます、月曜日の朝ですね、この時期が一番寒いそうです。
休みの余暇?YOUTUBEって時間潰しにはもってこいのメディアだと思うのですが、この頃、自分が登録しているYOUTUBEチャンネルは飽きてきたので、ほとんど観ていなくてどちらかと言えば、おすすめに表示されてきた動画を観ていて、その中で良かったなと思えるものをチャンネル登録している感じですかね。

Listen to the Mountains | Yatao | Ayasa Handpans

YOUTUBEチャンネル紹介をしなくなったのは、理由は単純に自分はこれは面白いと思える番組に巡り会えなくなっているのが現状なんですね。本当はYOUTUBEチャンネルの発掘をしたいのですが、なかなかYOUTUBEも膨大な動画数になってきたので、AIのお勧め精度も劣化してきているのかもしれませんね。

因みにティクトックは、色々と試した結果、立ち止まったものに対して興味があると認識しているだけでそれほどレコメンド能力のあるAIではないような気がします。そして自分はティクトックやYOUTUBEのショートはあまり観ないですね。尺が短いのでやはり情報量は少ないから、どうしても人を引き寄せようと大袈裟や色気で釣っている様な動画が多い印象を受けます。

著者名  @taoka_toshiaki

※この記事は著者が40代前半に書いたものです.

Profile
高知県在住の@taoka_toshiakiです、記事を読んで頂きありがとうございます.
数十年前から息を吸うように日々記事を書いてます.たまに休んだりする日もありますがほぼ毎日投稿を心掛けています😅.
SNSも使っています、フォロー、いいね、シェア宜しくお願い致します🙇.
SNS::@taoka_toshiaki

OFUSEで応援を送る

タグ

AI, youtube, YOUTUBEチャンネル, YOUTUBEチャンネル紹介, ショート, チャンネル, ティクトック, メディア, レコメンド能力, 余暇, 大袈裟, , 時間潰し, 月曜日, 現状, 番組, 発掘, 精度, 興味, 色気,

アナリティクスのタグマネージャーがかなりだな。かなり。

2022.03.19

Logging

おはよう御座います。
今日は土曜日ですね、昨日は全国的な雨模様でしたね。

さて、本日はアナリティクスのことを書きました、かなり自分的にはショッキングな内容です😱。

アナリティクスのタグマネージャーがかなりやばいなって事が分かった。特にリアルタイムの概要なんて半端ないですけど・・・モバイルでアクセスするとどこまで位置情報取られてしまうのだろうか?と思うぐらいの精度です。

まぁ殆どは基地局の情報までしか情報をユーザーに渡さないと思いますが、Gさんはかなり正確な位置情報は取られていることが確実だと思います。いやーこれは凄いな。今までこのビックデータをGさんなどの巨人が収集していたのかと思うと、あぁーこれは人を操ることは可能な力だなって思ってしまいます。

使い方一つで情報はかなり協力な武器にもなるだなってアナリティクスのタグマネージャーを使用してみて感じました、また情報を制すものが世界を制すと言っても過言ではないと思います。

情報こそ、この情報社会では価値なのだと誰かが言っていたけれど、ホントそれだと思いますよ!!

著者名  @taoka_toshiaki

※この記事は著者が40代前半に書いたものです.

Profile
高知県在住の@taoka_toshiakiです、記事を読んで頂きありがとうございます.
数十年前から息を吸うように日々記事を書いてます.たまに休んだりする日もありますがほぼ毎日投稿を心掛けています😅.
SNSも使っています、フォロー、いいね、シェア宜しくお願い致します🙇.
SNS::@taoka_toshiaki

OFUSEで応援を送る

タグ

アクセス, アナリティクス, かなり, こと, これ, ショッキング, タグ, データ, どこ, ビック, マネージャー, もの, モバイル, ユーザー, リアルタイム, 一つ, 世界, , , 今日, 位置, 使い方, 使用, 内容, , 半端, 協力, 収集, 可能, 土曜日, 基地, 巨人, 情報, 昨日, 本日, 概要, 正確, 武器, 殆ど, 精度, 過言, 雨模様,

HUNTERxHUNTERの文字が生成できるサービスを作りましたよ。

2021.10.22

Logging

今日はお昼ぐらいから、天気が良くなりましたね、、昨日はどんよりしていて自分のテンションもどんより気味でしたのでブログをお休みしていました。そんな中でも一応、プログラムして一つのサービスを世に出しました?!

さて、タイトル通りHUNTER☓HUNTERの文字が生成できるサービスを作りましたよ。ってお話です。これを作った経緯はこういうサービスは有るには有るけど、精度がいまいちなものばかりだったので作ったわけです。今回は漢字をひらがなに変換する機能は使用していません、理由はレンタルサーバーでは漢字をひらがなにするという処理を自前が出来ないのです、だからAPIに頼る必要があるのです。しかしながら、、、このサービスが軌道に乗り回転数(PV)が上がればAPI制限の上限に達しAPIが使用できない懸念があるのでAPIを使用するのは控えました。

今はそんな事はないのですけどね。そんな理由からハンター文字生成サービスは、あまり負荷のかからない処理にしています。Twitterでシェア出来るので共有して頂けたら幸いです😁。

追記:※漢字で入力してハンター文字に変換できるように対応しています.

https://hxh-moji.com/

追記:HUNTERXHUNTERの作者である漫画家、冨樫先生はいつ連載再開出来るのでしょうかと思っているファンも多いかと思います。自分も首を長くして待っていますが、中々、難しいじゃないかなと…。いろいろな説が出ているのですが、本当のことを知っているのは関係者ぐらいのものでしょう。恐らく病気かなにかの説が正しいような気がします。言えないってことはそういう事なのかなぁって思います。いちファンとしては、期待せずに待つのみですね。

著者名  @taoka_toshiaki

※この記事は著者が40代前半に書いたものです.

Profile
高知県在住の@taoka_toshiakiです、記事を読んで頂きありがとうございます.
数十年前から息を吸うように日々記事を書いてます.たまに休んだりする日もありますがほぼ毎日投稿を心掛けています😅.
SNSも使っています、フォロー、いいね、シェア宜しくお願い致します🙇.
SNS::@taoka_toshiaki

OFUSEで応援を送る

タグ

API, API制限, HUNTER×HUNTER, PV, Twitter, タイトル通りHUNTER☓HUNTER, テンション, レンタルサーバー, 上限, 作者, 冨樫先生, 懸念, 漢字, 精度, 経緯, 自前, , 負荷, 軌道, 追記,

変えられるのは未来だけというKREVAさんの新曲が良い感じ!

2021.09.09

Logging

昨日、高知県はトコロにより雨でしたが、今日は晴れ模様だと思います。この頃、天気予報の精度が上がっているように感じます、これも人工知能の恩恵なのかなぁと…。

さて、9月8日はKREVAさんの日らしくて、新曲が2曲ほどアップされていました??。その中でも「変えられるのは未来だけ」という曲がリズムも詞も良い感じでいつまでも聞いていられる。KREVAさんの作る曲はリズムが良くていつまでも聞いていられる心地良さが音程にあるです(強調)。そして歌詞が良いですよね「頑張ろう」って思えるです?。そんな前向きになれる歌詞が多いのもKREVAさんの音楽の特徴かと思います。

KREVA 「変えられるのは未来だけ」MUSIC VIDEO

著者名  @taoka_toshiaki

※この記事は著者が40代前半に書いたものです.

Profile
高知県在住の@taoka_toshiakiです、記事を読んで頂きありがとうございます.
数十年前から息を吸うように日々記事を書いてます.たまに休んだりする日もありますがほぼ毎日投稿を心掛けています😅.
SNSも使っています、フォロー、いいね、シェア宜しくお願い致します🙇.
SNS::@taoka_toshiaki

OFUSEで応援を送る

タグ

2, 8, , KREVA, アップ, いつ, これ, トコロ, リズム, , 予報, 人工, 今日, 前向き, 天気, 強調, 恩恵, 感じ, 新曲, , 昨日, 晴れ, , 未来, 模様, 歌詞, 特徴, 知能, 精度, , , 音楽, 音程, , 高知県,

Twitterプロフィールからスパムみたいなアカウントかを機械学習で判定してみた。

2021.06.28

Logging

Twitterプロフィールからスパムみたいなアカウントかを機械学習で判定してみました。

機械学習にしてもらう①。

何故、このような事を考えたかはスパムみたいなアカウントってぱっと見で人は区別できるよねって思ったのでLobeというソフトを使って画像解析(機械学習)してモデルをエクスポートし、そのモデルをテンソルフローで使用して動作確認してみました。

機械学習にしてもらう②

結果は、まぁまぁの精度だったのでモデルをお裾分けしますね。因みにTwitterのプロフィール画像のスクリーンショットを行った時のソースコードも提供します。

尚、機械学習に使用したプロフィール画像は400枚ほど(少ない?)です、ok-image(一般人)とng-image(スパムみたいなアカウント)というラベルを付けて学習させてます。

model::https://zip358.com/ai-model/tw-profile/saved_model.pb (?モデルの中身はtensorboardでご確認を!)

zip358com
zip358
# Generated by Selenium IDE
import time
from selenium import webdriver
from webdriver_manager.chrome import ChromeDriverManager

from selenium.webdriver.common.by import By
from selenium.webdriver.common.action_chains import ActionChains
from selenium.webdriver.support import expected_conditions
from selenium.webdriver.support.wait import WebDriverWait
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.common.desired_capabilities import DesiredCapabilities
from selenium.webdriver.support.ui import Select

class twss():
	def setup_method(self):
		self.driver = webdriver.Chrome(ChromeDriverManager().install())
		self.vars = {}

	def teardown_method(self):
		self.driver.quit()

	def screenshots(self):
		self.driver.get("https://twitter.com/")
		self.driver.set_window_size(945, 900)
		with open('twname.dat','r',encoding="utf-8") as f:
			for line in f:
				FILENAME = "X:\\var\\www\\html\\labo_ai\\twss\\image\\screen_" + line.replace('\n', '') +".png.webp"
				self.driver.get("https://twitter.com/" + line.replace('\n', ''))
				time.sleep(2)
				self.driver.save_screenshot(FILENAME)
		f.close()
		self.driver.quit()
twss = twss()
twss.setup_method()
twss.screenshots()

著者名  @taoka_toshiaki

※この記事は著者が40代前半に書いたものです.

Profile
高知県在住の@taoka_toshiakiです、記事を読んで頂きありがとうございます.
数十年前から息を吸うように日々記事を書いてます.たまに休んだりする日もありますがほぼ毎日投稿を心掛けています😅.
SNSも使っています、フォロー、いいね、シェア宜しくお願い致します🙇.
SNS::@taoka_toshiaki

OFUSEで応援を送る

タグ

358, 400, ai-model, com, https, lobe, model, ng-image, ok-image, SA, tw-profile, Twitter, zip, アカウント, エクスポート, お裾分け, コード, ショット, スクリーン, スパム, ソース, ソフト, テンソル, フロー, プロフィール, モデル, ラベル, 一般人, , , 何故, 使用, 判定, 動作, 区別, 学習, 提供, , 機械, 画像, 確認, 精度, 結果, 解析,

兎にも角にも

2020.12.08

Logging

人工知能で効率化を行う、何でも良いから人工知能の技術で解決できるだろうとか…思っている人もいるかと思いますが、実際、人工知能と言われている技術は機械学習と言われているものが大半です。

機械学習で出来ることは確かにいっぱいあるのだけど、精度の良い結果を出したいのなら失敗データや成功データが膨大に必要になります。いま、それを極力抑えて同じ結果が出るライブラリも登場してきましたが、やはりそれでもデータは必要になります。

データが100件しかないものを機械学習で頑張って勉強させてもポンコツな回答をする人工知能が生まれるだけです。データサイエンスとかいう職業が生まれるぐらい、機械学習にはデータがかなり大事な要素になります。

機械学習ってなにか、膨大なデータをコンピューターに学習させ、そこから共通点を導き出し振る舞いを行うものです。基本的に殆どのエンジニアはライブラリを使用して結果から振る舞う処理を書いたり、ライブラリを微調整してその後の処理を行うなどしかしません。なので機械学習というのは完璧に近いものは出来ますが、完璧ではないのです。

精度が悪い機械学習なら、ちょっと見た目が違っただけでたちまち、間違った回答を示します。なので、いま兎にも角にも機械学習とかいう流れがありますが、機械学習や人工知能というのは万能では有りません。

未だに、翻訳アプリの精度は片言な表現なのですから・・・。

著者名  @taoka_toshiaki

※この記事は著者が40代前半に書いたものです.

Profile
高知県在住の@taoka_toshiakiです、記事を読んで頂きありがとうございます.
数十年前から息を吸うように日々記事を書いてます.たまに休んだりする日もありますがほぼ毎日投稿を心掛けています😅.
SNSも使っています、フォロー、いいね、シェア宜しくお願い致します🙇.
SNS::@taoka_toshiaki

OFUSEで応援を送る

タグ

100, いま, エンジニア, かなり, こと, コンピューター, サイエンス, そこ, それ, データ, ポンコツ, もの, ライブラリ, , 人工, 使用, 共通点, 処理, 効率, 勉強, 回答, 大事, 大半, 失敗, 学習, 実際, , 微調整, 必要, 成功, 技術, 機械, 殆ど, 登場, 知能, 精度, 結果, 職業, 要素, 解決,

50年後の未来は仕事がないかもしれない?あの人も懸念!

2020.01.23

Logging

50年後の未来は仕事がないかもしれないと思い出した、ここ最近、人工知能の事を知れば知るほどこれから先、ひとのお仕事がロボットや人工知能に置き換えることが出来てしまうよなという事が、馬鹿な自分にも分かりだした。アルファベット社のサンダー・ピチャイ氏も人工知能は規制を設けないといけないと言っている(記事参照:グーグルのピチャイCEO、AIには規制が必要と主張–「疑問の余地はない」)。

記事で語られているような事以外もいろいろな事に悪用が出来てしまうと思います。それぐらい人工知能は万能ツールなんですね。先日、NHKのおはビズでも放送されていたけど、熟練職人と同じ精度のモノを人工知能が創りだす事ができた。これで分かる通り複雑なことも今の段階でも出来てしまう。
つい最近では紅白歌合戦で美空ひばりの歌声を真似た人工知能が物議となったが。これを冒とくだという人もいるけれど、それを受け入れていかなければこの先、生きていけないと自分は感じた。これから先は人工知能という万能ツールを使いこなす側か作る側にいないと大変だと思う。

美空ひばり(AI歌唱) / あれから(メモリアル映像)

大変な時代を生きていくのは自分たちの世代ではなく、いまの子供達だと思います。その子供達が大人になった時、仕事があるのだろうか、また、お金という概念が無くなるかもしれない。もし人間が働かなくて良くなるとお金という概念がなくなる。全てロボット(人工知能)に任せひとは想像的なことだけに力を入れれば良い時代になるのではないか。

だからといって、勉強や仕事をしなくても良いと思ってはダメ、世界が楽園のような時代になるまでは何世代も先のような気がしますので、逆に今まで以上に競争社会が激化するのではないかと考えています。

50年後先どうなるか?
いろいろな本で共通して書かれていることは間違いなく人がそうしたいという欲望なので、おそらく人はそれを達成します。今までもそうして技術は進化してきています。皆さんも想像してみてください、おそらく50年先は今の仕事の殆どの仕事は不要なものになると思います。

著者名  @taoka_toshiaki

※この記事は著者が40代前半に書いたものです.

Profile
高知県在住の@taoka_toshiakiです、記事を読んで頂きありがとうございます.
数十年前から息を吸うように日々記事を書いてます.たまに休んだりする日もありますがほぼ毎日投稿を心掛けています😅.
SNSも使っています、フォロー、いいね、シェア宜しくお願い致します🙇.
SNS::@taoka_toshiaki

OFUSEで応援を送る

タグ

--, 50, AI, CEO, NHK, アルファベット, いろいろ, お仕事, グーグル, ここ, こと, これ, サンダー, それ, それぐらい, ツール, ビズ, ピチャイ, ひと, もの, ロボット, 万能, 主張, , , 人工, , 仕事, 余地, , 先日, 冒とく, 参照, 必要, 悪用, , 懸念, 放送, 最近, 未来, 歌声, 段階, 熟練, 物議, 疑問, 知能, 精度, 紅白歌合戦, 美空ひばり, 職人, 自分, 複雑, 規制, 記事, 通り, 馬鹿,

地震予知・予測なら「予知するアンテナ」に有料会員登録しました。

2017.07.29

Logging


地震予知・予測なら「予知するアンテナ」に有料会員登録しました。
むかしTVで放送されていた時から知っていたのだけど、徐々に精度を上げてきて
いるみたいなので、この度、有料会員になりましたよ。
540円で地震一週間前に大地震が起きるかどうかわかるなら
安いものじゃないのかな。一週間後に地震が起きるかもしれないとわかれば
例えばエレベーターに乗るのは控えようとか、海に近づくのはやめようなど
気をつけることが出来るし、身構えることは可能じゃないのかなと思い
本日、有料会員になりましたよ。

7月起こった震度5以上の地震を全て的中!1週間前に地震を予知する「予知するアンテナ」
? 早川教授の理論をベースに70%の的中率を実現 ?
https://prtimes.jp/main/html/rd/p/000000003.000026595.html

この記事を読んでこれは凄い事だと思いますよ。
特に会社にも影響するだろうし、ちょっとセコい話をすると
株価などにもかなり影響することなんじゃないだろうかとか・・・。
登録したい方は
こちらからどうぞ・・・。
https://yochisuru-antenna.jp/

著者名  @taoka_toshiaki

※この記事は著者が30代前半に書いたものです.

Profile
高知県在住の@taoka_toshiakiです、記事を読んで頂きありがとうございます.
数十年前から息を吸うように日々記事を書いてます.たまに休んだりする日もありますがほぼ毎日投稿を心掛けています😅.
SNSも使っています、フォロー、いいね、シェア宜しくお願い致します🙇.
SNS::@taoka_toshiaki

OFUSEで応援を送る

タグ

アンテナ, エレベーター, セコい話, ベース, むかしTV, 全て的中, 南海トラフ地震, 地震予知, 大地震, 岩波新書, 早川教授, 有料会員, 株価, 理論, 的中率, 精度, 震度5以上,

ビックデータと機械学習仲良しこよし・・・か!!

2016.12.13

Logging


機械学習の精度を上げるには大量のデータを瞬時に捌ける
サーバが必要になるという事を気付いた・・・。
そういやそうだ。学習すればするほど過去のデータも
見直さないといけなくなる。
Gさんは良い商売しているなと機械学習やビックデータを処理する
環境を無料で与えているけど、よくよく見ると制限があり
それ以降は有料になっている。
有料だけど月々の費用はかなり安いところが
ほんと、凄いところです。
でっ!!
ビッククエリーのPHPバージョンの使い方ですけど
Gさんのライブラリを読み込んでSQLを発行して返却値を
もらうだけ・・・凄く簡単。
詳しくはこちら
まずはライブラリ読み込みしてオブジェクトをインスタンスする。

次にSQLを発行する。

最後に発行した情報の返却値を抽出する。

じゃ機械学習はどうしたら良いのか・・・。
勉強中です、GさんがAPI系版出しているだけど、お高いです?。
https://cloud.google.com/prediction/docs?hl=ja
そちらは比較的に優しい、優しいと言っても難しいですけど・・・。
Gさんがオープンソースで提供されているサービスに比べたら優しいという事です。
https://www.tensorflow.org/
機械学習をちょちょいと使えるようになればカッコイイですけどね。
自分には程遠い感じがします、千里の道も一歩からというけれど・・・
今のところ、簡単な機械学習ならっていう感じでニュートラルな機械学習は
難しいですね_(:3」∠)_。
http://qiita.com/tags/TensorFlow

著者名  @taoka_toshiaki

※この記事は著者が30代前半に書いたものです.

Profile
高知県在住の@taoka_toshiakiです、記事を読んで頂きありがとうございます.
数十年前から息を吸うように日々記事を書いてます.たまに休んだりする日もありますがほぼ毎日投稿を心掛けています😅.
SNSも使っています、フォロー、いいね、シェア宜しくお願い致します🙇.
SNS::@taoka_toshiaki

OFUSEで応援を送る

タグ

API系版, Gさん, PHPバージョン, SQL, インスタンス, オブジェクト, サーバ, ビッククエリー, ビックデータ, ライブラリ, 使い方, 千里, 月々, 有料, 機械学習, 機械学習仲良しこよし, 瞬時, 程遠い感じ, 精度, 返却値,

IT業界の今後を読める人?

2016.11.16

Logging


IT業界の今後を読める人はどれぐらいいるのだろうか?
おそらく、今後の鍵となるのが人工知能だということぐらいしか
自分はわからないけれど、ソフトウェアせよWEBにせよ、
人工知能が大きな役割を果たすことは間違いない。
この馬鹿な頭で考えてもかなりの脅威であり
今後、何かしらこの業界に身をおいていると人工知能という
モノと関わりが出てくるように思えます。
人工知能はいまから勉強していて損はないモノだと…。
プログラムが分からなくともどういう物か
というのをざっくりで良いから知っておいたほうが良い。
例えば、人工知能判断の精度を上げたい場合、
機械学習しないといけないので、膨大なデータ(ビックデータ)が
不可欠になるということなどを知識として
持っておいくと良い。またグーグルの研究者達が目指しているのは
自立で物事を理解し判断するモノだとか・・・。
そういう事を知っておくだけでも
今後、対応することが出来るのではないかと思えます。
それにしても・・・今後、どうなるか?わからないですね。
ちなみに日本のIT業界転換期となりそうなのは2020年頃かと思います。
 

著者名  @taoka_toshiaki

※この記事は著者が30代前半に書いたものです.

Profile
高知県在住の@taoka_toshiakiです、記事を読んで頂きありがとうございます.
数十年前から息を吸うように日々記事を書いてます.たまに休んだりする日もありますがほぼ毎日投稿を心掛けています😅.
SNSも使っています、フォロー、いいね、シェア宜しくお願い致します🙇.
SNS::@taoka_toshiaki

OFUSEで応援を送る

タグ

IT業界転換期, グーグル, ソフトウェアせよWEB, どれぐらい, ビジネス, ビックデータ, プログラム, 人工知能, 人工知能判断, 役割, 暮らし, 物事, 研究者達, 精度, 脅威, 自立, 関わり,

HDD1テラバイトへ移行しWINDOWS10へアップデート

2015.08.04

Logging


 
Windows10へアップデートを行いました。ネット上の評判もまずまずだったので結構早めのアップデートだったかなと思います。使い勝手は良い方ですが若干、マウスの感度が良くなり操作するときに誤作動することが頻発しておきたのでマウスの精度を少し下げました。それ以外は特に問題なく動いています。Xboxアプリも触ってみましたがゲームタイトルが若干すくないのと、ゲームコントローラーでプレイできないのが不満で今のところ様子見です。
Windows10にアップデートするにあって、HDD500ギガバイトから1テラバイトに変更したのですが問題なく動いています。裸族シリーズではない製品でHDDをクローンしたのですが特に問題なくクローンできました。SSDもクローンできるようなので今後、1TBのHDDからSSDへ移行するときも重宝しそうな気がします。ちなみに今回の移行でかかった費用は1万円です。

著者名  @taoka_toshiaki

※この記事は著者が30代前半に書いたものです.

Profile
高知県在住の@taoka_toshiakiです、記事を読んで頂きありがとうございます.
数十年前から息を吸うように日々記事を書いてます.たまに休んだりする日もありますがほぼ毎日投稿を心掛けています😅.
SNSも使っています、フォロー、いいね、シェア宜しくお願い致します🙇.
SNS::@taoka_toshiaki

OFUSEで応援を送る

タグ

HDD1テラバイト, HDD500ギガバイト, SSD, Windows10, Xboxアプリ, アップデート, クローン, ゲームコントローラー, ゲームタイトル, ネット上, マウス, 使い勝手, 感度, 移行, 精度, 若干, 裸族, 製品, 評判, 費用,