Anglesharpというライブラリの話。

2021.03.13

Logging

久しぶりに技術的なお話の記事を書きます。AnglesharpというのはC#などでスクレイピングするときにスクレイピングを補助してくれるライブラリで結構人気のあるライブラリなるようです。スクレイピングするコードは下記のようになります。この書き方が至ってシンプルで書きやすいのではないかなと思っています。

http://anglesharp.github.io/

var Url = $"https://zip358.com/";
var querySelector = $"#index_post_list > li.clearfix.num1.type1 > div > h3";
var document = BrowsingContext.New(Configuration.Default.WithDefaultLoader()).OpenAsync(Url).Result;
var element = document.QuerySelector(querySelector);
Console.WriteLine($"blogtitle is {element.InnerHtml}");

このライブラリはとても良いのですが、一つ問題があります。スクレイピングするのですが・・・これjavascriptがOFFの状態でスクレイピングされるのですね。どうもこのコードではJSがONにはならないようですね。因みに自分はそのことを知っていなかったのでどハマリしました。大手の検索サイトなどはjavascriptがOFFの状態でも閲覧できるようになっている事を知りました、試しにブラウザをOFFの状態にしてみるとソースコードがかなり違っていてJSのONの状態とは情報が差異がある事が理解できると思います。

Anglesharpのコンフィグ設定(init)でエージェントなどを設定してあげると上手くJSがONの状態をスクレイピングすることが可能なのかもしれません。動画を見る限りではまだかもしれません・・・。

AngleSharp NET Headless Browsing

著者名  @taoka_toshiaki

※この記事は著者が40代前半に書いたものです.

Profile
高知県在住の@taoka_toshiakiです、記事を読んで頂きありがとうございます.
数十年前から息を吸うように日々記事を書いてます.たまに休んだりする日もありますがほぼ毎日投稿を心掛けています😅.
SNSも使っています、フォロー、いいね、シェア宜しくお願い致します🙇.
SNS::@taoka_toshiaki

OFUSEで応援を送る

タグ

, , 358, anglesharp, BrowsingContext, clearfix, com, Configuration, default, div, document, element, gt, https, index, li, LIST, new, num, OpenAsync, POST, QueryS, querySelector, quot, result, type, url, var, WithDefaultLoader, zip, お話, コード, シンプル, スク, とき, ピング, ライブラリ, レイ, 下記, 久しぶり, 人気, 書き方, 補助, 記事, ,

スマホの次は複合現実(mixed reality)ですね。

2020.01.28

Logging

複合現実とは何か、現実と仮想との融合だと思ってもらえれば良いかと思います。下記の動画を見ていただけると分かりやすいかも。HoloLens2(ホローレンズ2)というメガネのようなもの装着すると現実と仮想の映像が合わさって表示されるというもの、いまは結構大きな機器を装着しているけれど、最終的にメガネぐらいに軽量になるのではと思っています。

Microsoft shows off HoloLens 2 mixed reality headset at MWC

これで何が変わるかといえば、動画に流れているように仕事のアシスタントなどの補助が出来たりする。自分はMR(複合現実:mixed reality)が普及するとエンターテイメントな事に使われたり、新たな広告市場になるのではないかと思っています。スマホの次は間違いなく複合現実なんだと思うけど、これが普及するまではもう少し時間がかかるのではないかと思っています。

先に流行るのはスマートグラスかなという考え、スマートグラスが認知されて来る頃にはホローレンズもかなり改良されているだろうなと感じました。

https://www.youtube.com/watch?v=SzYx0GS9Vfg

著者名  @taoka_toshiaki

※この記事は著者が40代前半に書いたものです.

Profile
高知県在住の@taoka_toshiakiです、記事を読んで頂きありがとうございます.
数十年前から息を吸うように日々記事を書いてます.たまに休んだりする日もありますがほぼ毎日投稿を心掛けています😅.
SNSも使っています、フォロー、いいね、シェア宜しくお願い致します🙇.
SNS::@taoka_toshiaki

OFUSEで応援を送る

タグ

2, 8, 90, com, e-n, HoloLens, mixed, Mr, reality, xrVXh, youtube, アシスタント, いま, エンターテイメント, くら, これ, スマート, スマホ, ホロー, メガネ, もの, レンズ, 下記, , 仕事, 仮想, , 動画, 市場, 広告, 映像, 時間, 普及, 機器, , 現実, 自分, 融合, 表示, 装着, 補助, 複合, 軽量,

ふん、やんのかσ(゚∀゚ )オレ、やんのか。

2015.04.08

Logging


入って一ヶ月ぐらい経ち職場の人との関わりも出てきた頃、営業さんが仕事を取ってきたWEBで検索してゴニョゴニョするシステムを作ってくれとのこと、自分、筆頭に開発して良いとのことだ。先輩方は補助に回るとかで肝となる検索部分を担当することになった!。はいって一ヶ月で無茶ぶりだろと思っていたが一ヶ月後、完成することが出来た。そして、この開発により、もう一人の新人の技量がわかった・・・・。そう、彼はプログラムが組めないのだ(おいらは組めます)。

著者名  @taoka_toshiaki

※この記事は著者が30代前半に書いたものです.

Profile
高知県在住の@taoka_toshiakiです、記事を読んで頂きありがとうございます.
数十年前から息を吸うように日々記事を書いてます.たまに休んだりする日もありますがほぼ毎日投稿を心掛けています😅.
SNSも使っています、フォロー、いいね、シェア宜しくお願い致します🙇.
SNS::@taoka_toshiaki

OFUSEで応援を送る

タグ

web, おいら, オレ, ゴニョゴニョするシステム, プログラム, ふん, 一ヶ月, 一人, 仕事, 先輩方, 営業, 技量, 新人, 検索部分, 筆頭, 職場, , 自動, 補助, 開発, 関わり,

我らクレイジー★エンジニア主義を読んで{数年前に}。

2014.09.18

Logging

我らクレイジー★エンジニア主義を読んで思ったことを記載しときます。この本にはクレイジーと記載していますが、クレイジーというよりは異端児と呼ばれている研究者に焦点を当てた本です。ちなみにこの本は2006年に出版{2010年再版されています}されてた本ですが、この本で紹介された研究者達はいま、その分野では有名な研究者になっています。例えば山海 嘉之(さんかいよしゆき)さん、ロボットスーツHALを開発した人です。いまでは介護の補助や歩行の補助など、いろいろな分野で使用されるようになっています。
2006年に書かれた本ですが、いま読んでもためになる本になっています。ちなみに研究に焦点を置いた本ではなく、その人の考え方{哲学的}などを著者がインタビューを通して書かれている本になっています。

著者名  @taoka_toshiaki

※この記事は著者が30代前半に書いたものです.

Profile
高知県在住の@taoka_toshiakiです、記事を読んで頂きありがとうございます.
数十年前から息を吸うように日々記事を書いてます.たまに休んだりする日もありますがほぼ毎日投稿を心掛けています😅.
SNSも使っています、フォロー、いいね、シェア宜しくお願い致します🙇.
SNS::@taoka_toshiaki

OFUSEで応援を送る

タグ

いまいち, インタビュー, エンジニア主義, さんかいよしゆき, ロボットスーツHAL, 介護, 出版, 分野, 嘉之, 山海, 我ら, 数年前, , 歩行, 焦点, 異端児, 研究者, 研究者達, 考え方, 著者, 補助,