2019-02-22

Microsoft MVP更新の季節。CData Excel Add-Inを使って、Twitter での活動情報をさくっと可視化してみる

Dynamics Microsoft Dynamics365 Twitter API CData

f:id:sugimomoto:20190222144331p:plain

Microsoft MVP 更新の季節がやってまいりました。

昨年から Microsoft MVP の更新スケジュールが代わって、年度末である3月に統一されましたね。

Microsoft MVPの申請・更新には日々どのような形でコミュニティに貢献したかどうかを数値化、文書化して貢献度を可視化する必要があります。

昨今ですと、Twittter や FacebookなどSNSでの活動状況も入力するシチュエーションがあるかと思います。

ただ、ちまちまと記録をさかのぼって、集計するのもなかなか骨が折れる作業ですね・・・。

そこで、そんな面倒な作業を CData Excel-Addinを使って、Excel上でさくっと集計・可視化する方法を紹介します。

f:id:sugimomoto:20190222145219p:plain

Microsoft MVP 向け CData ツール・ドライバーの無償提供

f:id:sugimomoto:20190222144804p:plain

ちなみに、通常 CData Driver は有償のツールなのですが、Microsoft MVP向けには個人利用の範囲で無償のライセンスを提供しています！

以下のURLから申請することが可能ですので、是非申し込んでみてください。

https://www.cdata.com/jp/community/mvp/

私のTwitterやFacebookに直接ご質問頂いても大丈夫です。

ちなみに、今回はTwitterですが、FacebookやInstagram、Youtube、Wordpress などのExcel Add-inもあるので、そちらも集計することが可能です。

必要なもの

・Twitter アカウント

・Twitter ClientID・ClientSecret・AccessToken・AccessTokenSecert

・CData Twitter Excel-Addin

実施手順

それでは具体的な実施手順を説明していきます。

Twitter アプリ登録・認証用情報の取得

まず CData Excel Add-inを通じて Twitter APIにアクセスするために、Twitter APIアクセスに必要な各種情報を入手します。

詳しい入手方法は以前私がBlogにしたためているので、参考にしてみてください。若干UIが変わっていますが、大筋は同じです。

kageura.hatenadiary.jp

CData Twitter Excel-Addinのダウンロード・インストール

次に、CData Twitter Excel-Addinを入手します。

以下からトライアル、もしくはMVP用のライセンスがあればそれを使って、ダウンロードし、セットアップしておいてください。

https://www.cdata.com/jp/drivers/twitter/excel/

f:id:sugimomoto:20190222144453p:plain

セットアップは特に難しい設定はありません。

そのまま次へ次へと進めていくだけでインストールが完了します。

f:id:sugimomoto:20190222145849p:plain

CData Twitter Excel-Addin の接続設定

インストールが完了するとこのようにExcelにCData タブが追加され、アドインを利用できるようになります。

f:id:sugimomoto:20190222150003p:plain

それでは、実際に接続をしてみましょう。「取得元Twitter」をクリックして、接続画面を表示します。

表示された接続プロパティ画面に、事前に取得しておいた「ClientID・ClientSecret・AccessToken・AccessTokenSecert」を入力します。

f:id:sugimomoto:20190222150107p:plain

OKをクリックして、接続テストを行い、以下のように「サーバーに接続できました」というメッセージが表示されれば、OKです。

f:id:sugimomoto:20190222150159p:plain

CData Excel Add-inでは、SQLベースでTwitterのデータが取得できるようになっています。

SQLを知らなくとも、Twitter データがテーブルやビュー・カラムの構造になっているので、かなり直感的にTwitterのデータが取得できると思います。

今回は自分自身のツイートデータを取得したいので「Tweets」テーブルを選択します。

f:id:sugimomoto:20190222150232p:plain

そして、下のSQL入力フォームに、各種条件のSQLを記述します。

例えば今回私はDynamics のデータを取得したいので、「[From_User_Screen_Name] = 'sugimomoto'」で私のツイートの絞り込み、「Text Like '%Dynamics%'」で Dynamics に部分一致の指定を行います。

SELECT * FROM [CData].[Twitter].[Tweets] WHERE [From_User_Screen_Name] = 'sugimomoto' and Text Like '%Dynamics%'

入力完了後、OKをクリックすれば

f:id:sugimomoto:20190222150515p:plain

このように過去に私がDynamics についてつぶやいたツイートの一覧が取得できます！

f:id:sugimomoto:20190222150533p:plain

あとはピボットテーブルで、IDの合計でツイート数、Favorite_CountとりRetweet_Countを取得すればOKですね。

（私の今年度の Dynamics ツイート少ないな・・・orz）

f:id:sugimomoto:20190222150605p:plain

注意事項

Twitterの無償APIは最新のものから最大3200件までしか、ユーザータイムラインのツイートを取得できません。

上記出力結果は3200件のデータを裏で取得して、そのなかの Dynamics が含まれているキーワードだけ算出しています。

1年間に3200ツイート、1ヶ月260ツイートくらいまでが取得の目処になるので、Twitter中毒の方は要注意。4半期に1回とかやっておくといいかもしれないですね。

有償のAPIを使えば、もっと柔軟に取得できますが、なかなかお高いです・・・。（最低1万円はくだらない。）

終わりに

いかがでしたでしょうか！

今回はTwitter データだけでしたが、前述の通り他にもFacebookやInstagram、YoutubeなどのDriverもあるので、是非各種Driverでも試してもらえればと思います。

何かわからないこと、こんなことできないの？　みたいなご質問があれば、TwitterかFacebookでお気軽にどうぞー。

2019-02-14

2月20日（水）に虎ノ門で「Windows女子部/初心者向け：Dynamics365 カスタマーサポート業務での活用ポイント解説」を開催します！

f:id:sugimomoto:20190214184050p:plain

Burikaigi 2019に続いて、Dynamics 365 関係で登壇することになりました。

今回はMS MVP の方々がリレー形式で登壇を担当する企画を開催している「Windows女子部」で発表します。

connpass.com

そして、珍しくというか、久しぶりにというか、初心者向けと銘打って、カスタマーサポート機能を中心に「Dynamics 365 Customer Engagement」を解説する予定です。

具体的にどんなお話をするの？

でも、そもそも今回お話する「Customer Engagement」、名前からして、今までDynamics 365 に関わってこなかった方々にはよくわかんないですよね。

顧客管理とかSFAとかMAとか、キーワードや世の中の風潮？みたいなもので大事っぽいっていうのはなんとなく理解している。

でも、じゃあ Dynamics 365 を使ったからって何が変わるの？　っていうのがイメージできない。そんな方が多いのではないかなーと漠然と思ってます。

今回実は初心者向けとは銘を打ちつつも、個人的に結構新しい試みをしていて、昨今のビジネスモデルを土台にしながら、Dynamics 365 をどのように解釈すればいいのか？　その上で、なんでこんな機能があるのか？　どんな風に使えるのか？　というのをお話する予定です。

是非、今まで Dynamics 365 を触ったことが無い人も、触っている人も、開発している人も、参加してもらいたいなーと思います。

2019-02-08

3月1日（金）に仙台で「【JAZUG TOHOKU】ZOZO前澤社長お年玉リツイート企画のビッグデータに立ち向かう方法」を開催します！

Azure Twitter Power BI 勉強会

f:id:sugimomoto:20190208000317p:plain

1月28日（月）に日本マイクロソフト品川本社セミナールームで開催した「ZOZO 前澤社長のお年玉リツイート企画は、どのくらい世の中に影響を与えたのか？」の仙台スピンオフを開催することになりました！

イベントページはこちらからどうぞ。

【JAZUG TOHOKU】ZOZO前澤社長お年玉リツイート企画のビッグデータに立ち向かう方法 - connpass

東京開催時のTwitterまとめもあるので、どんな感じなのかなーと気になっている方は見てみてください。

togetter.com

会場は以前も Azure 勉強会でお世話になりましたSRIAさんのオフィスです！　仙台駅から徒歩圏内。

www.sria.co.jp

セッション終了後には LT ＆ビアバッシュ会になっていますので、是非お気軽にご参加ください！

2019-02-06

大量の JSON データからスキーマを解析して、Azure SQL Database にレプリケートする：CData Sync

CData CDataSync Azure SQL SQL Server JSON Twitter

先日公開した「500万件を超えるTwitter のリツイートデータを取得・分析する方法」で取得したJSONデータをAzure SQL DataBaseにレプリケートして分析するアプローチを紹介しました。

bit.ly

ただ、元記事ではアプローチの紹介が中心で、実際の手順や機能に関する紹介ができなかったので、本記事で改めてこのCData Syncの使い方・およびJSONデータのスキーマを解析して Azure SQL DataBaseにレプリケートする方法を紹介しようと思います。

f:id:sugimomoto:20190205154120p:plain

2019-02-01

500万件を超えるTwitter のリツイートデータを取得・分析する方法　-Twitter Premium Search API を実際に使ってみてわかった嵌りポイントとその対策-

Twitter API Power BI Azure SQL Server C#

このBlogでも告知していましたが、今週の月曜日1月28日に日本マイクロソフト品川本社セミナールームC+D で「ZOZO 前澤社長のお年玉リツイート企画は、どのくらい世の中に影響を与えたのか？」を開催しました！

開催前はこんな色物企画に本当に人が来てくれるのだろうか？　とずっと半信半疑でしたが、最終的に申込みは4営業日ほどで満席（108席）になりまして、イベント当日もたくさんのツイート、ご質問をいただけて、個人的にとても得るものも多く、楽しいイベントとなりました！

以下のまとめでどんな雰囲気だったか垣間見ることができるのではないかなと思います。

togetter.com

ただ、私自身がやったことは、このイベントのタイトルから見えるよりも、ひたすら地味なもので、Twitter API の「制約」・「制限」・「仕様」をどのように回避・咀嚼しながら、対象の500万リツイートデータ取得と分析に挑むのか？　といったものでした。

もちろん、取得してきたデータから見えてきたことも最後のほうで紹介したいと思いますが、この記事としては今後 Twitter 上でキャンペーンなどを展開していく企業やユーザーの役に立ってもらえればという考えで書いています。

こんな色物な取り組みですが、是非いろいろと参考にしてもらえると幸いです。

なお、さっくりと見たい方にはほぼ同じ内容のスライドも公開しています。

ZOZO前澤社長お年玉リツイート企画のビッグデータに立ち向かう方法 -Twitterのビッグデータを分析するために、実際にやってみてわかった嵌りポイントとその対策- from Kazuya Sugimoto

www.slideshare.net

なんでこんなことをしようと思ったのか？
立ちはだかる「嵌りどころ・落とし穴」たち
1.どうやって500万件のリツイート（＋アルファ）を取得するの？
- 仮に ZOZO前澤社長が本気で API を使って抽選しようとした場合どうなるか？
2.どうやって対象のツイートを識別するの？
- そもそも何を取得したかったのか？
- 「query」をどう使う？　 Premium API の Search パラメータで使えるオペレーション一覧
- で、どうする？　悩みどころ etc
- じゃあ「#月に行くならお年玉」のハッシュタグが含まれていない引用ツイートも、ハッシュタグツイートも取得するならどうするか？
- Premium Search API の補足：ベースの検索は範囲指定：30日間の範囲で指定可能
- Premium Search API の補足：ページネーションはさかのぼり方式
- Premium Search API の補足：取得できないもの
- そうして、ツイートを取得しました。
ボトルネック③　どうやって Twitter の JSON データを構造化するの？
- Basic Tweet Format
- Extended Tweets Format
- Retweets Format
- Retweets and Quote Tweets Format
- 解決アプローチ
ボトルネック④ 　どうやって DB にデータを流し込むの？
- めんどくさいこと
- データ投入アプローチ
終わりに

2019-01-25

Java クライント開発における Web API の実装アプローチまとめ REST vs GraphQL vs Swagger vs OData

Web API REST GraphQL API エコシステム OData Swagger

f:id:sugimomoto:20190124172011p:plain

最近作成してきた、Java クライント開発における Web API の実装アプローチのまとめ記事です。

初めての試みでしたが、私自身多くの発見があり、とてもいいナレッジになったのではないかなと思っています！

この記事では、まとめとして総括した内容を中心にお伝えしますが、是非以下の記事郡を見てほしいと思います。

タイトルでは vs なんてことを書いていますが、それぞれの特徴を把握してもらうことを目的としています。

各記事の一覧

Java クライント開発におけるWeb API の実装アプローチ：その1 Web API を活用する上で意識したい APIエコシステム - Morning Girl

Java クライント開発における Web API の実装アプローチ：その2 一般的なREST API編 - Morning Girl

Java クライント開発における Web API の実装アプローチ：その3 Swagger（OpenAPI）Code Generate 編 - Morning Girl

Java クライント開発における Web API の実装アプローチ：その4 OData 編 - Morning Girl

Java クライント開発における Web API の実装アプローチ：その5 GraphQL 編 - Morning Girl

Java クライント開発における Web API の実装アプローチ：その6 CData Driver編 - Morning Girl

REST・Swagger・OData・GraphQL比較表

あまりマルバツ表は好きではないのですが、改めてそれぞれの特徴をまとめました。

REST を比較するのはあまりにも難儀ですが、ここからも「結局の所 REST はデザインパターンである」ということが明確にわかるのではないかなと思います。

あまり意図してつけたわけではないのですが、思ったよりもそれぞれの長所・短所がはっきりする結果になったのではないかなと思います。

f:id:sugimomoto:20190124170655p:plain

Swagger・OData・GraphQL それぞれを使ってみた所感

Swagger

f:id:sugimomoto:20190119212047p:plain

Code Generate で生成した Client SDKの使いやすさはピカイチでした。現在公開されている API を右肩あがりですので、知っておいて損は無い仕様だと思います。

ただ、ドキュメントのアップデートに気を使っているかどうかは、そのプロバイダーにかかっていますし、メタデータは Swager の記述アプローチ次第なところもあるので、その辺を注意しながら使う必要はあると思います。

OData

f:id:sugimomoto:20190121012145p:plain

スキーマやリクエストのコントロールのアプローチは確立されていますが、アーキテクチャとしての複雑さ、使う敷居の高さは若干否めません。

ただ、Salesforce・Dynamics 365・SAP などが OData で API を提供しているため、エンタープライズ領域としては把握しておいて損は無いでしょう。

特に、ツールやサービスとの接続には依然多く利用されるシチュエーションに溢れているため、この点を知っているかどうかで、選択肢の幅は大きく変わります。

GraphQL

f:id:sugimomoto:20190124171559p:plain

上でも述べた通り、Java Client から使う、となるとまだまだ敷居の高さは否めません。

実際のところ Java で使うよりも、React といった Java Script系クライアントライブラリで利用する、というシチュエーションの方が、現在は多いと思います。

しかしながら、Github や Shopify がパブリックなAPIを公開したところを見るに、これからエンタープライズ領域でも見かけるシチュエーションは多くなるのではないでしょうか。

Microsoft も一部ベータ的に GraphQL API を公開し始めましたし、今後ウォッチしておく価値はあると思います。

最後に。なぜ開発者が API のエコシステムを理解しておくことが大事なのか？

おそらく Swagger と GraphQL が出てきたタイミングから Web API（REST）の捉え方は変わってきています。

ただ Web API（ないしREST）として、それらに接することはあまりにも脆弱になってしまったのだと思います。

Swagger で CodeGenerate することを知らなければ、クラス名を一から記述することになり

OData で Metadata を取得することを知らなければ、動的なアプリケーションは作りづらい

仕様であることを理解しているだけで、開発者が取れる選択肢は格段に多くなります。

そして、それが適切かつ保守しやすい開発に繋がることは間違いないでしょう。

API を実装する側ではないからといって、API エコシステムを疎かにしてはいいわけではない理由がここにあると思います。

是非、各仕様・エコシステムを理解してもらいながら、開発に役立ててもらえたらなと思います。

2019-01-25

Java クライント開発における Web API の実装アプローチ：その6 CData Driver編

CData Web API OData JDBC Java

前回まで主に各API規格の仕様ベースでアクセスする方法を紹介してきました。

今回はちょっと趣向を変えて、JDBC、つまりデータベースを操作するSQLベースで Web API にアクセスする方法を提供している CData JDBC Driver を紹介します。

最初の記事はこちらから。

bit.ly

CData JDBC Driver って何？

Facebook や Twitter 、Dynamics 365 や Salesforce といった 100 を超えるクラウドサービス・Web API・NoSQL に JDBC で接続を可能にするという Driver・ライブラリ製品です。

f:id:sugimomoto:20190123143715p:plain

例えば今まで紹介してきた以下の API の注文（orders）テーブルに CData JDBC Driver でアクセスする場合は

https://app.swaggerhub.com/apis/sugimomoto/CDataNorthWindSample/1.0.0

「SELECT * FROM orders」といったSQLの形式で実行するだけで実現可能になります。

f:id:sugimomoto:20190123143726p:plain

CData Driver 内部ではリクエストされたSQL を分解し、Web API の HTTP Request に組み立て直し、レスポンスの JSON をレコードセット形式にフォーマット化、クライアントに返すという仕組みです。

実際にCData Driver のログを確認してみると、以下のように SELECT 文が発行された後、HTTP Requestが実行されていることがわかるかと思います。（ログデータは若干省略しています。）

[Connection: 8] Executing query: [SELECT [orders].[order_id], [orders].[order_date],[orders].[customer_id],[orders].[employee_id],FROM [orders]LIMIT 100].
[Connection: 8] [Request] GET https://cdatanorthwindsampleapiserver.azurewebsites.net/api.rsc/orders?$select=order_id%2Corder_date%2Ccustomer_id%2Cemployee_id&$top=100
User Authorized SSL Cert: [TRUSTED] Server Cert: [LS0tLS1CRUdK] Accepted: True
[Connection: 8] [Response] HTTP/1.1 200 OK, 1844 Bytes Transferred
[HTTP Headers]
HTTP Auth Scheme: 3
GET /api.rsc/orders?$select=order_id%2Corder_date%2Ccustomer_id%2Cemployee_id&$top=100 HTTP/1.1
Host: cdatanorthwindsampleapiserver.azurewebsites.net
Accept-Encoding: gzip, deflate
User-Agent: CData Data Provider Engine - www.cdata.com - Accepts: gzip
OData-MaxVersion: 4.0
accept: application/json;odata.metadata=full
x-cdata-authtoken: 1q0E5n7v8V1k4r1U5g0e

[Connection: 8] [Response]
[HTTP Headers]
HTTP/1.1 200 OK
Cache-Control: private
Transfer-Encoding: chunked
Content-Type: application/json;charset=utf-8
Content-Encoding: gzip
Vary: Accept-Encoding
Server: Microsoft-IIS/10.0
X-Powered-By: CData API Server
OData-Version: 4.0;
X-AspNet-Version: 4.0.30319
X-Powered-By: ASP.NET
Date: Wed, 23 Jan 2019 05:34:37 GMT
{"@odata.context":"hello$metadata#orders","value":[{"order_id": 10248, "employee_id": 5, "order_date": "1996-07-04", "customer_id": "VINET"}]}
[Connection: 8] Page successful: 100 results (1,525 ms).

対象の API

f:id:sugimomoto:20190120000738p:plain

対象の API は今までと一緒です。

https://app.swaggerhub.com/apis/sugimomoto/CDataNorthWindSample/1.0.0

同じようにODataベースの REST API なので、CData JDBC OData Driver を使ってアクセスします。以下からトライアルのダウンロードが可能です。インストール後、Javaプロジェクトでライブラリを参照してください。

https://www.cdata.com/jp/drivers/odata/jdbc/

操作も同じように注文データ（orders）と注文明細データ（order_details）を取得して結合したものをコンソールで出力するというものです。

実装コード

APIに接続する場合の接続文字列は CData OData JDBC Driver 独自のものになります。URIでAPIのエンドポイントを指定し、認証部分記述すればOKです。

jdbc:odata:URL=https://cdatanorthwindsampleapiserver.azurewebsites.net/api.rsc;Custom Headers=x-cdata-authtoken:XXXXXXXXX;

実際にOrdersテーブルのとOrderDetailsテーブルにアクセスしたソースコードはこちら。

gist.github.com

以下のリポジトリでもソースコードを公開しています。

github.com

Java クライアントアプリケーションから CData Driver を使うポイント

まずはなんといってもSQLでアクセスできることでしょう。

HTTP動詞やWeb APIのエンドポイントURLなどを意識することなく、データの取得操作が実施できます。

String sql = "SELECT [orders].[order_id], [orders].[order_date],[orders].[customer_id],[orders].[employee_id],[order_details].[discount],[order_details].[product_id],[order_details].[quantity],[order_details].[unit_price]FROM [order_details] LEFT OUTER JOIN [orders] ON [order_details].[order_id] = [orders].[order_id] LIMIT 100;";

Statement stat = conn.createStatement();
boolean ret = stat.execute(sql);

それに加え、ただSELECTするだけではなく、JOINやWhereなど、SQLの規格に則った記述ができるので、各エンドポイントからデータを取得して、それをクライアントサイドでマージするといった処理を書く必要がありません。

また JDBC 規格で提供しているので、スキーマ・メタデータ情報にもアクセスすることができます。

以下の処理は取得したデータのMetadataからカラム名を特定し、それぞれのカラム名とカラムバリューを取得している行です。

for(int i=1;i<=rs.getMetaData().getColumnCount();i++) {
    System.out.println(rs.getMetaData().getColumnName(i) +" : "+rs.getString(i));
}

終わりに

今回は Java クライアントアプリケーションから接続した例で紹介しましたが、JDBC接続をサポートしているアプリケーションやサービスからも内部に組み込むだけで、アクセス先をDBではなくWeb APIに切り替えるということが可能です。

前回までは各仕様のインターナルな部分におけるエコシステムを中心とした紹介でしたが、こういった外部でも育まれているエコシステムを活用することも一つの選択肢だと思います。

次回は今までの投稿内容をふくめて、まとめに入りたいと思います。（長かった・・・）

Microsoft MVP 向け CData ツール・ドライバーの無償提供

必要なもの

実施手順

Twitter アプリ登録・認証用情報の取得

CData Twitter Excel-Addinのダウンロード・インストール

CData Twitter Excel-Addin の 接続設定

注意事項

終わりに

具体的にどんなお話をするの？

各記事の一覧

REST・Swagger・OData・GraphQL比較表

Swagger・OData・GraphQL それぞれを使ってみた所感

Swagger

OData

GraphQL

最後に。なぜ開発者が API のエコシステムを理解しておくことが大事なのか？

CData JDBC Driver って何？

対象の API

実装コード

Java クライアントアプリケーションから CData Driver を使うポイント

終わりに

CData Twitter Excel-Addin の接続設定