Sparkのドキュメントによると、DataFrameは、データの分散コレクションを「名前付きの列」に整理したもので、概念的には、リレーショナルデータベースのテーブルや、R、Pythonのデータフレームと同等だが、グラフデータ用に「高度に最適化されている」という。

Sparkのドキュメントによると、DataFrameは、データの分散コレクションを「名前付きの列」に整理したもので、概念的には、リレーショナルデータベースのテーブルや、R、Pythonのデータフレームと同等だが、グラフデータ用に「高度に最適化されている」という。  GraphFrameは構造化データファイル、Apache Hiveのテーブル、外部データベース、既存のリレーショナルデータベースなど、多様なソースから構築できる。Scala、Java、Python、R向けのAPIが用意されている。  Databricksによると、GraphFramesはDataFrameが持つスケーラビリティと高いパフォーマンスの恩恵を受けており、Scalaの他、Java、Pythonでグラフデータ処理を利用するための単一のAPIを提供する。これにより、PythonとJavaから「GraphX」の全てのアルゴリズムを利用可能になった。この他、SparkのGraphXライブラリと似た一般的なグラフデータ処理をサポートする他、「幅優先探索(BFS)」や「モチーフ探索」といった新しいアルゴリズムにも対応する。  また、GraphFramesはDataFrameのデータソースを完全にサポートするので、Hadoop向けの列指向ストレージ「Parquet」形式や、JSON、CSVなど、さまざまなデータフォーマットを利用できる。  同社は公式ブログで、ソーシャルネットワークを簡単なグラフとして表現した例を用いてGraphFramesを紹介している(ユーザーが「点」、ユーザー間の関係が「辺」)。「どのユーザーが最も影響力があるか」「ユーザーAとBは知らない者同士だが、引き合わせるべきか」といった問いに対して、グラフのクエリやアルゴリズムを使って答えを出すことができるという。  この例では、ユーザー(点)は「名前」「年齢」を、ユーザー間の関係(辺)は「関係タイプ」といった属性を持つが、GraphFramesでは点と辺をDataFrameとして保存する。多くのクエリはDataFrame(またはSQL)クエリとなるため「グラフに対するクエリを簡単に表現できる」と、Databricksは説明している。 Apache Hive 2.0では「Hive-on-Spark parallel ORDER BY」が実装  Spark周辺のプロダクト開発が活性化しており、直近では、米クラウデラが開発を主導するHadoop向けSQLクエリエンジンの最新版「Apache Hive 2.0」でも、Sparkに対する並列ソート機能「Hive-on-Spark parallel ORDER BY」などが新たに実装されている。

http://headlines.yahoo.co.jp/hl?a=20160307-00000092-zdn_ait-sci

More Posts from Sendaikoyama and Others

9 years ago

ブリュッセルでは27日、広場を起点にテロに抗議する大行進が計画されていた。ヤンボン内相が「趣旨は理解できるが安全を保証できない」と難色を示し、主催者は延期を発表したが、広場には追悼のため多くの市民が訪れていた。 

http://headlines.yahoo.co.jp/hl?a=20160328-00000009-jij-eurp

9 years ago
#カシオペア 上り最後の定期運行 #仙台駅

#カシオペア 上り最後の定期運行 #仙台駅

9 years ago

わたしは人間が大好きだから、共感の表現が大好きだから、理系として新しく物を作るという局面に立って、まだ精神的に少しくるしくなることはある。それでも前よりはだいぶ、冷静に考えることができるようになってきた、少なくとも自分ではそんな気がしている。

https://medium.com/@rubberyuzu/%E6%81%8B%E6%84%9B%E3%81%AB%E3%82%A4%E3%83%8E%E3%83%99%E3%83%BC%E3%82%B7%E3%83%A7%E3%83%B3%E3%81%AF%E3%81%84%E3%82%89%E3%81%AA%E3%81%84%E8%A9%B1-a93b04b3ac9

8 years ago
The first pirate website in the world to open mass and public access to tens of millions research papers
9 years ago
ODESZA - Light (feat. Little Dragon)
From the forthcoming 'In Return (Deluxe Edition)' album. Out September 18th on Counter Records. Also available in limited edition 10" vinyl, out November 1st. Available for pre-order now at http:
9 years ago

こんにちは。

sendaikoyama - 日誌
日誌

今日明日あした

68 posts

Explore Tumblr Blog
Search Through Tumblr Tags