日本語に特化したOCR、文書画像解析Pythonパッケージ「YomiToku」でとさでん時刻表を解析

2024.12.17

Logging

おはようございます.日本語に特化したOCR、文書画像解析Pythonパッケージ「YomiToku」でとさでん時刻表を解析出来るかやってみました.とさでん交通は未だに時刻表がPDFなのでとても見にくいのです、業者さんは提案しないのかな.

ちなみにとさでん交通さんとは高知県の路面電車になります.地元のために頑張ってる公共交通機関ですが過去には経営が厳しい時期もあったようです.今も大変は大変だと思います、高知県は基本的には公共交通機関を使用する人よりも車通勤が多いです、そして少子高齢社会が進んでいる県でもあるので.

そんな公共交通機関の時刻表PDF解析してHTML化してみようと機械学習のPythonライブラリ「YomiToku」を使用してみました、結果、なかなか精度は良いのですがHTML化された物をそのままでは使用できないので手直しが必要です.

恐らく普通のPDF表だったら、綺麗にHTML化出来ると思いますが、とさでん交通さんの時刻表が特殊過ぎるのでこういう結果になったのだと自分は結論付けました.

ちなみに巷では一回画像へ変換しないといけないなどと記載している記事を見かけますが、PDFファイルのまま、OCR解析出来ます.

自分はこんな感じのコマンドラインで実行しました.

yomitoku ./pdfs/akebono.pdf -f html -o output_html

明日へ続く

著者名  @taoka_toshiaki

※この記事は著者が40代前半に書いたものです.

Profile
高知県在住の@taoka_toshiakiです、記事を読んで頂きありがとうございます.
数十年前から息を吸うように日々記事を書いてます.たまに休んだりする日もありますがほぼ毎日投稿を心掛けています😅.
SNSも使っています、フォロー、いいね、シェア宜しくお願い致します🙇.
SNS::@taoka_toshiaki

OFUSEで応援を送る

タグ

コマンドライン, でん交通さん, ファイル, ライブラリ, 公共交通機関, 厳しい時期, 地元, 少子高齢社会, , 手直し, 文書画像解析パッケージ, 時刻表, 未だ, 機械学習, , 精度, 経営, 路面電車, 車通勤, 高知県,

Photo by Brett Jordan on Pexels.com

この記事は何分で読めますを導入しました.何分で読めましたか?

2024.07.25

Logging

おはようございます.この記事は何分で読めますを導入しました.コードは下記のサイトコピペした後、少し自分のように手直しをしましたがほぼほぼコピペだと思っていただいて間違いないです.

https://fukuro-press.com/wordpress-display-reading-time

これにより購読してくれる人やリピーター様が増えるのを切に願っています.導入するまえに少し調べると購読者が増えるというような記事を見かけたので取り入れた感じです.読んでもらって何かの役に立てばこちらも嬉しいです.先日、書いた通り役に立ちたいという気持ちはありますが喜んでほしいとかいう気持ちはないです.

blue and purple color pencils
Photo by Pixabay on Pexels.com

「これ良いわ、良い話聞いたわ、こんな人がいるだ、自分だけじゃなかった」等などと思って頂けたら幸いです.基本的にこのブログは技術共有と雑記で成り立っています、これで一応、数ヶ月置きに収益も出ているので、一応、恩返してきな要素もあります🌝.皆さんありがとうございます🙇.

ちなみにまだ程遠いですが自分がブログだけで生活が出来るように慣れば、いろいろな人の励みにはなると思っています.自分にも出来そうという思いを持ってほしいですね.

明日へ続く.

著者名  @taoka_toshiaki

※この記事は著者が40代前半に書いたものです.

Profile
高知県在住の@taoka_toshiakiです、記事を読んで頂きありがとうございます.
数十年前から息を吸うように日々記事を書いてます.たまに休んだりする日もありますがほぼ毎日投稿を心掛けています😅.
SNSも使っています、フォロー、いいね、シェア宜しくお願い致します🙇.
SNS::@taoka_toshiaki

OFUSEで応援を送る

タグ

Photo by Pixabay on Pexels.com, コード, コピペ, リピーター様, 下記, 収益, 少し, , 恩返してき, 慣れば, 手直し, 技術共有, 数ヶ月置き, 気持ち, 生活, 皆さん, 要素, 購読者, 通り役, 雑記,

キャッチコピーを考える、昨日の記事続き。

2023.12.05

Logging

おはようございます、メルカリで売るキャッチコピーを考えるために売れるキャッチコピーをみんなが使っているchatGPTさんとBardさんに考えてもらいました。それをXに自動でポストするようにここは人の手でコードを書きました。無料の生成AIは完璧なコードを書けないので?手直しが必要になります。

chatGPT4Turboとかなら、コードの生成も凄いらしいだけども有料で月3000円ぐらいの支払いを行わないといけないので、それだったらそのお金を別のことに使用したいというのが本音。

お金に余裕のある人は試せているのだろうけど、基本的にあまり自分はお金に余裕はないのでポチれないのが本音ですかねぇ。本当は試したいのだけども・・・・。

話し戻しまして無料版でも十分、キャッチコピーを考えてくれるので有り難い。

ちなみにBardさんはこんな感じです。chatGPTに軍配が上がる・・・。

というわけで、メルカリ店よろしくお願いします🙇

https://jp.mercari.com/user/profile/808093563

明日へ続く。

著者名  @taoka_toshiaki

※この記事は著者が40代前半に書いたものです.

Profile
高知県在住の@taoka_toshiakiです、記事を読んで頂きありがとうございます.
数十年前から息を吸うように日々記事を書いてます.たまに休んだりする日もありますがほぼ毎日投稿を心掛けています😅.
SNSも使っています、フォロー、いいね、シェア宜しくお願い致します🙇.
SNS::@taoka_toshiaki

OFUSEで応援を送る

タグ

Bardさん, ChatGPT, chatGPT4Turbo, chatGPTさん, X, キャッチコピー, コード, みんな, メルカリ, メルカリ店, 余裕, , 手直し, 有料, 本音, 無料版, 生成, 生成AI, 自分, 軍配,

アイキャッチ画像を表示するように変更。PHPコード

2023.11.25

Logging

おはよう御座います、先日アイキャッチ画像を表示するように変更しました、PHPコードはこんな感じです。Bootstrapでレスポンシブ画像に対応しています。アイキャッチ画像を表示するようにした訳はデザインも変えたのでアイキャッチいれても変じゃないかなって思ったことです。そういう訳で先日の休みに対応しましたというのが経緯(いきさつ)です。

            <div>
              <?php
              print get_the_post_thumbnail_url() ? '<img src="' . get_the_post_thumbnail_url() . '" class="img-fluid">' : '';
              ?>
            </div>

そんな休みの日にこんなタイムラインが流れてきました、こんなのが浸透したら商売が破綻すると思う人がいると思うけれども、たぶん今の生成AIで凄いことが出来るのに殆んどの人が使えていない。これが浸透するのにかなり月日がかかると思います。一般の人に浸透するにはラグが存在するので、それまでにどうすれば良いか対処出来ると思います。ちなみにポストが消えてしまった時のために上のポストの内容を解説しておくと、画像(デザイン)からフロントエンドエンジニアやデザインナーが行うHTML作成作業を生成AIが変わって行ってくれる。今の所、完璧なコードが生成される訳ではないので手直しが必要ですが、いずれは必要なくなることは時間の問題という話なんだけど、実際ひとが思っている未来の斜め上を行くのが未来かと思います。なので落胆はせずに上手く取り入れていく方が賢明かなって自分は思います。

明日へ続く。

著者名  @taoka_toshiaki

※この記事は著者が40代前半に書いたものです.

Profile
高知県在住の@taoka_toshiakiです、記事を読んで頂きありがとうございます.
数十年前から息を吸うように日々記事を書いてます.たまに休んだりする日もありますがほぼ毎日投稿を心掛けています😅.
SNSも使っています、フォロー、いいね、シェア宜しくお願い致します🙇.
SNS::@taoka_toshiaki

OFUSEで応援を送る

タグ

Bootstrap, class, div&gt, get_the_post_thumbnail_url, gt, img src, img-fluid&quot, lt, php, print get_the_post_thumbnail_url, quot, アイキャッチ, デザインナー, ラク, レスポンシブ画像, 商売, 手直し, 生成AI, 経緯, 落胆,

ワードプレスのchatGPT-APIを使ったプラグイン #chatGPT

2023.06.28

Logging

おはようございます、ワードプレスのchatGPT-APIを使ったプラグインを作りました。1つ目は日本語記事を英語に翻訳してUPするプラグインです、このプラグインは公開時に一回だけ英語に変換されます。その後手直しが可能です。これからは日本語で記事を書いて英語化されたものを公開するとグローバルに記事を見ていただけるかなって思って作ったのですがどうなんでしょうね?

もう一つ目は、一週間分の記事を単語から連想して記事を自動で書いてくれるといったちょっと問題作のプラグインです。これで記事を書くことから開放されます。記事はすべて予約投稿になります。記事を直したい場合は編集画面で手動で記事を直してください。

両方ともGitHubとQiitaでソースコードを公開しています、ご自由にご使用ください。なお転売禁止します。

こちらのリンクからソースコードは参照できます。

日本語記事を英語に翻訳するプラグイン

単語から連想して記事を自動作成するプラグイン

著者名  @taoka_toshiaki

※この記事は著者が40代前半に書いたものです.

Profile
高知県在住の@taoka_toshiakiです、記事を読んで頂きありがとうございます.
数十年前から息を吸うように日々記事を書いてます.たまに休んだりする日もありますがほぼ毎日投稿を心掛けています😅.
SNSも使っています、フォロー、いいね、シェア宜しくお願い致します🙇.
SNS::@taoka_toshiaki

OFUSEで応援を送る

タグ

chatGPT-API, github, qiita, すべて予約投稿, ソースコード, プラグイン, リンク, ワードプレス, 両方, 公開時, 単語, 問題作, 手動, 手直し, 日本語, 日本語記事, 編集画面, 英語, 英語化, 転売,

人工知能と仕事とクリエイティブな事の今後見通し。 #chatGPT #Alpaca

2023.04.25

Logging

おはようございます、今日はchatGPTを使用せずに記事を書いていきます。まず、人工知能と仕事とクリエイティブな事の今後見通しですが、今までクリエイティブな事が出来なかった人もクリエイティブな事が出来るようになると思いますが、今まで普通のクリエイティブな創作が出来ていた人は今まで以上の品質の創作が可能になると思います。超一流の創作物が出来る可能性もあると思います。

今までの作品をダリやミッドジャーニーに投げ込むと自分の力量以上の生産物が出来る可能性ありです、またアドビのAdobe Fireflyなどを使えば出力はベクターなどでクリエイターなら手直しも出来るのでハイクオリティの作品が出来る可能性はあります。なので一番、ダメージを被るのは超一流プロデザイナーさんだったりするのではと内心思っています。

これからのクリエイターは人柄も大事になってくるのではないかな?。同じような生産物が出来る場合、この人から物を購入したいと思う気持ちが大事になると。人柄だったりブランド力が今まで以上に大切なったりすると思いますし、今でも創作の過程をVlogなどで紹介している人がいますが、そういう事が今まで以上に必要になってくると思います。

クリエイティブな仕事は数十年後には仕事でなくなるかもですが、モノ作りは無くならないと思います。電子書籍が登場した時、本はすべて電子になると言われていましたがそうはならなかった。それと同じで、仕事も奪われないじゃないのかなと思います。

著者名  @taoka_toshiaki

※この記事は著者が40代前半に書いたものです.

Profile
高知県在住の@taoka_toshiakiです、記事を読んで頂きありがとうございます.
数十年前から息を吸うように日々記事を書いてます.たまに休んだりする日もありますがほぼ毎日投稿を心掛けています😅.
SNSも使っています、フォロー、いいね、シェア宜しくお願い致します🙇.
SNS::@taoka_toshiaki

OFUSEで応援を送る

タグ

Adobe Firefly, ChatGPT, Vlog, アドビ, クリエイター, ダメージ, ダリ, ハイクオリティ, ベクター, ミッドジャーニー, 人工知能, 人柄, 出力, 創作, 創作物, 力量以上, 手直し, 超一流, 過程, 電子書籍,

これからの人は大変だなって思う。 #chatGPT4

2023.03.26

Logging

おはようございます、これからの人は大変だなって思う。今から20年後の世界は仕事があるのか、それすらも予想がつかない時代になってきている気がします。国民の7割ぐらいは仕事というものが無くベーシックインカムで暮らすという世の中になる気がする。

【落合陽一】「GPT-4」を実演で解説!“スイカ八つ橋かき氷”ラーメンを生成した結果「うまそう」だった。GPT4のスゴさは?『ドラえもん』の誕生は?教育の鍵は「文学」、そして「残業がなくなる」時代へ。

落合陽一 氏がGPT-4を使用して何しているのか、分からないホワイトカラー職の仕事をしている人は今後、20年でその仕事は消え去る可能性は高いじゃないかな?。タスク系のお仕事、特にAデータをBデータに置き換えているような仕事は確実にGPT-4に置き換わる。コピペしたり入力してエクセルで計算式をゴニョゴニョ書いていたりする仕事は消えて無くなる。

プログラマーは消えるかと思えない、むしろ今まで以上に必要とされる気がするのが現状ですね。特にいろいろとマルチに出来る技術者はこれまで以上に必要とされる。最終的に細かい調整は今まで以上に必要となるから。AIが書いたコードを手直ししたり機能追加する仕事が増えるのではないかと今の時点では予想できているけど、今後20年後には手直しすらもAIが出来るようになるだろうと。

最後にGPT-4に直近で仕事を奪われそうな仕事はなに答えてもらったら高知県が誘致している会社になってしまった。

GPT-4は、人間に近いレベルで文章を生成できることから、ライティングや編集作業に活用されることが期待されています。また、質問に対する適切な回答を提供する能力があります。そのため、カスタマーサポートやコールセンターのオペレーターに代わって、チャットボットが顧客対応を行うことが可能になります。これらの例からも分かるように、GPT-4は人間の仕事を奪うというよりも、効率化や効果の向上を図るためのツールとして活用されることが期待されています。¹

ソース: Bing との会話 2023/3/24(1) GPT-4は記者の仕事を奪うのか? ITmedia NEWSの記事を自動 …. https://www.itmedia.co.jp/news/articles/2303/22/news178.html アクセス日時 2023/3/24.
(2) IoTリモートモニタリングサービスとは|株式会社ゴモジー Gomogy …. https://note.com/gomogy/n/n8271555b6780 アクセス日時 2023/3/24.
(3) 【後編】GPTが仕事を奪うかもしれないって論文の考察と対策を …. https://note.com/981_cayman/n/n09e9bc31f0e9 アクセス日時 2023/3/24.

著者名  @taoka_toshiaki

※この記事は著者が40代前半に書いたものです.

Profile
高知県在住の@taoka_toshiakiです、記事を読んで頂きありがとうございます.
数十年前から息を吸うように日々記事を書いてます.たまに休んだりする日もありますがほぼ毎日投稿を心掛けています😅.
SNSも使っています、フォロー、いいね、シェア宜しくお願い致します🙇.
SNS::@taoka_toshiaki

OFUSEで応援を送る

タグ

AI, bing, GPT, GPT-4, IoTリモートモニタリングサービス, エクセル, オペレーター, カスタマーサポート, チャットボット, プログラマー, ベーシックインカム, マルチ, ライティング, 後編, 手直し, 株式会社ゴモジー Gomogy, 直近, 考察, 落合陽一, 論文,

OpenAIのcodexでプログラムを自動生成することが出来るけど?

2022.02.04

Logging

おはよう御座います、今日は巷(エンジニア界隈)で流行っているAIに自然言語で命令するとプログラムコードを生成してくれるというものを試しました。

今回試したのはOpenAIのcodexです、感想はこんな感じです。OpenAIのcodexでプログラムを自動生成することが出来るだけど、手直ししないといけない場面が出てくるのが今の現状ですね😣。但し固定したもの、九九表を作ってといえばそれに適したコードを書いてくれて手直しなどは必要ないです。なので雛形のコードが作れるようになっていると考えて頂けたら良いと思います。

Creating a Space Game with OpenAI Codex

試してみたい方はこちらのサイトから試してみてくださいな。

著者名  @taoka_toshiaki

※この記事は著者が40代前半に書いたものです.

Profile
高知県在住の@taoka_toshiakiです、記事を読んで頂きありがとうございます.
数十年前から息を吸うように日々記事を書いてます.たまに休んだりする日もありますがほぼ毎日投稿を心掛けています😅.
SNSも使っています、フォロー、いいね、シェア宜しくお願い致します🙇.
SNS::@taoka_toshiaki

OFUSEで応援を送る

タグ

, AI, B-DvwOgw, codex, com, https, OpenAI, watch, www, youtube, Zm, エンジニア, コード, こちら, こと, サイト, それ, プログラム, もの, 九九, , 今回, 今日, 命令, 固定, 場面, , 感じ, 感想, 手直し, , 現状, 界隈, 自動生成, 自然, 言語, 雛形,

アクセス履歴からの見つめ直し。

2021.03.31

Logging

アクセス解析をこのサイトには導入しているのでアクセスログが管理画面から見えます、それを見ていると昔書いた記事などを読んでくださるユーザー様がいるわけです。そしてそんな記事を自分でも読み直すこともありますし、アクセスの多いプログラムの記事に関してはテコ入れする場合もあります。日記のような記事には手直しは殆どしません、あまりにも今と昔とでは考えが変わったなと思う記事は削除する場合もあります。

そんな中で自分が退社した時の記事に昨日、アクセスがあり改めて読み直しました。読んでいて、その気持ちを忘れないようにと思える一文がありました。それは「おかげさま」という気持ちです。自分はこの「お陰様」をよく忘れることがあります。ついつい自分を通してしまうことがあるのだけど、一呼吸おいて言葉を選ばないとなと思うことがあります。

別に人格者になりたい訳ではないですが、それで結構失敗もしているのでそう思った次第です。因みにアクセス数は過去のアクセス数と変わりない感じです。正直なところあと日に500ぐらいアクセス数が欲しいところですね。

著者名  @taoka_toshiaki

※この記事は著者が40代前半に書いたものです.

Profile
高知県在住の@taoka_toshiakiです、記事を読んで頂きありがとうございます.
数十年前から息を吸うように日々記事を書いてます.たまに休んだりする日もありますがほぼ毎日投稿を心掛けています😅.
SNSも使っています、フォロー、いいね、シェア宜しくお願い致します🙇.
SNS::@taoka_toshiaki

OFUSEで応援を送る

タグ

アクセス, おかげさま, お陰様, こと, サイト, それ, テコ入れ, プログラム, ユーザー, ログ, 一呼吸, 一文, , 人格者, , 削除, 場合, 失敗, 導入, 履歴, 感じ, 手直し, 日記, , 昨日, , 次第, 殆ど, 気持ち, 画面, 管理, 自分, 解析, 言葉, 記事, , 退社, 過去,

AI(人工知能)とAI(人工知能)が会話する時代に直ぐなる。

2018.01.30

Logging


?
この頃、寒い日が続きます。
そんな雪が降った日に、こんな記事が流れた「画像からAI(人工知能)がコーディングを行う」という記事、正直なところ「唖然」としました。
こんなにも早くコーディングという仕事を奪うのかと・・・。
たぶん来年ぐらいには複雑なWEBDESIGNのコーディングを行うサービスを海外の企業がグローバルに展開しそう、だからと言って「WEB会社」がなくなるかと言えばそうでもないし仕事が奪われることもないと感じます。
今でも数種類のDESIGNから、ほぼGUIでホームページが作成するサービスはありますが、其のことで会社が痛手になったなんてことは聞きません。
なので、今回のコーディングを行うサービスもある一定数のユーザーは、そちらに流れると思いますが、ソフトウェア会社やWEB会社が排他されることはないじゃないだろうかと思います。
もっと言えば、そのうちAIの記述したコーディングを人がチェックし手直しするような事になるだと思います。
ちなみに人工知能の学習させるのに使うのは人工知能らしいですね・・・。
人が人工知能を超えるため脳にPCを直結するというハイブリッドな研究も進んでいるそうです。
最終的に人は遺伝子を組み替えて脳の処理能力を上げるって話もあります。この頃、今までの絵空事が具現化されてきていて、あと10年もすれば世の中かなり変わりそうです。
※余談:クリスパー・キャスナイン(CRISPR/Cas9)遺伝子組換え技術が人には適応できないかもと言われていますが、自分は何れ誰かが安全な遺伝子組換え技術を開発すると思います。
大体、人が想像することは具現化してきてます、具現化出来ないことはもしかすると人は想像できないのかもしれませんね。

Ink to Code, a Microsoft Garage Project


?

著者名  @taoka_toshiaki

※この記事は著者が30代前半に書いたものです.

Profile
高知県在住の@taoka_toshiakiです、記事を読んで頂きありがとうございます.
数十年前から息を吸うように日々記事を書いてます.たまに休んだりする日もありますがほぼ毎日投稿を心掛けています😅.
SNSも使っています、フォロー、いいね、シェア宜しくお願い致します🙇.
SNS::@taoka_toshiaki

OFUSEで応援を送る

タグ

AI, DESIGN, GUI, web, WEBDESIGN, うち, グローバル, コーディング, こと, サービス, そちら, ソフトウェア, チェック, ところ, ホームページ, ユーザー, 一定, , , 人工, , 今回, 仕事, 企業, 会社, 会話, 作成, 展開, 手直し, 排他, , , 早く, 時代, 来年, 正直, 海外, 画像, 痛手, 知能, 複雑, 記事, 記述, , ,

php:3項演算子の使い方。

2017.09.16

Logging


3項演算子の使い方を解説しているサイトは
数多くあるので割愛します。プログラミングの記述例を貼っときます。

<?php
$a=10;
$ret = $a>9 ? "A9":"B9";
print($ret);
//A9

このような感じで3項演算子を使います、これあまり複雑怪奇な
書き方をしなければ自分は普通にコーディングに書いて良いような気がします。
トイウコトで3項演算子を使うと便利かな。
コードって書かなくなると何ていうか、自分の場合、苦労して覚えていないので
あっという間に忘れ去ってしまうですけどね。この頃、javascriptの記述や挙動がいまいち
つかめていない、javaとか言うものを全然勉強していないからなんだろうなと感じる事が多々あり。
もっと使う機会を増やしたいのだけど、この頃、PHPオンリーなので
何とも・・・、他人のコード見て自分もガリガリとコードを書きたいなと
思うのですけど、いまの自分が任されている仕事にゴリゴリ書くことが必要不可欠かと
言えばそうでもないですよね。
他人が書いたコードの修正や機能追加ってのは
どうしてもやりづらく、特にいわゆる普通のコードで
書いている場合、手直しが面倒くさい。普通のコードには
普通のコーディングしないと何だか、無駄な処理が増えるだけだなと。
逆に洗練されたコードは余分なものが殆どないので
下手に触ると挙動が変になるというデメリットもあるのですがね。
会社で難コーディングが書けない分、自宅でいろいろコードを書かないと
進歩がなさそうな気がします。その書くことに時間をこの頃使っていない気がします。
ちなみに自サイトのブログ以外のサイトを
昨日、映画を観終わって帰宅後リニューアルしました。
 
 

著者名  @taoka_toshiaki

※この記事は著者が30代前半に書いたものです.

Profile
高知県在住の@taoka_toshiakiです、記事を読んで頂きありがとうございます.
数十年前から息を吸うように日々記事を書いてます.たまに休んだりする日もありますがほぼ毎日投稿を心掛けています😅.
SNSも使っています、フォロー、いいね、シェア宜しくお願い致します🙇.
SNS::@taoka_toshiaki

OFUSEで応援を送る

タグ

$a&gt, 3項演算子, A9, AM, B9, javascript, php, ret, コード, トイウコト, プログラミング, やさしい教本, 他人, 使い方, 手直し, 挙動, 書き方, 記述, 難コーディング,