什麼是Apache Spark? | 台灣精品獎-歷屆得獎名單
![什麼是Apache Spark?](https://i.imgur.com/DERULla.jpg)
ApacheSpark是一個快速的通用型叢集運算引擎,可以部署在Hadoop叢集中或獨立模式下。透過Spark,程式設計師可以使用Java、Scala、Python、R和SQL快速編寫應用程式, ...
![什麼是Apache Spark?](https://i.imgur.com/DERULla.jpg)
Spark 生態系統包括五個主要元件:
1. Spark Core 是通用的分散式資料處理引擎,建構於其上的程式庫適用於 SQL、串流處理、機器學習和圖形運算,且可以在應用程式中一起使用。Spark Core 是整個專案的基礎,提供分散式工作分派、排程和基本 I/O 功能。
2. Spark SQL 是處理結構化資料的 Spark 模組,方便您使用同種方式存取各種資料來源。這個模組讓您可以使用 SQL 或熟悉的 DataFrame API 在 Spark 程式中查詢結構化資料。Spark SQL 支援 HiveQL 語法,並允許存取現有的 Apache Hive 倉儲。伺服器模式提供標準連線功能,使用者可以連接 Java 資料庫或開放資料庫。
3. Spark Streaming 讓您可以輕鬆建構可擴充的容錯串流解決方案。這項元件將 Spark 語言整合 API 融入串流處理,讓您也可以使用與批次工作相同的方式編寫串流工作。Spark Streaming 支援 Java、Scala 和 Python,且具備立即可用的有狀態「一次性」語意。
4. MLlib 是 Spark 可擴充的機器學習程式庫,並且提供工具讓實用的機器學習可以輕鬆擴充且容易使用。MLlib 包含許多常見的學習演算法,例如分類、迴歸、推薦和分群。它還包含工作流程和其他公用程式,例如特徵轉換、機器學習管道建構、模型評估、分散式線性代數和統計資料等。
5. GraphX 是用於圖形和圖形平行運算的 Spark API,將「擷取、轉換和載入」、「探索性分析」和「疊代圖運算」整合到同個系統,使用上相當靈活,可與圖形和集合完美搭配。除了高度靈活的 API 外,GraphX 也提供多種圖形演算法。它的效能不僅與最快的圖形系統不相上下,同時保有 Spark 的靈活性、容錯性和的易用性。
Apache Spark | 台灣精品獎-歷屆得獎名單
Apache Spark 入門(1) | 台灣精品獎-歷屆得獎名單
Apache Spark™ | 台灣精品獎-歷屆得獎名單
什麼是Apache Spark? | 台灣精品獎-歷屆得獎名單
什麼是Apache Spark? – Amazon Web Services (AWS) | 台灣精品獎-歷屆得獎名單
![](https://i.imgur.com/DERULla.jpg)
108 年度台灣精品獎獲獎產品 自行車攜行架
由「高鐵工業股份有限公司」生產的自行車攜行架獲得108年度台灣精品獎,以下為此獎項詳細資料整理:得獎產品:自行車攜行架...