亞馬遜云科技推出五項數據庫和分析服務功能,提高PB級數據處理能力
Amazon DocumentDB Elastic Clusters可將客戶的文檔工作負載擴展到支持每秒數百萬次寫入并存儲PB級數據
Amazon OpenSearch Serverless可幫助客戶在無需手動配置、擴展或管理底層基礎設施的情況下運行搜索和分析工作負載
(相關資料圖)
Amazon Athena for Apache Spark的功能讓客戶得以使用Apache Spark進行交互式分析,并將分析所需時長從數分鐘縮短到一秒以內
Amazon Glue Data Quality自動測量、監控和管理數據湖和數據管道中的數據質量,將數據分析和規則識別的時間從幾天縮短到幾小時
Amazon Redshift現在支持跨多個亞馬遜云科技可用區的高可用配置
亞馬遜云科技在2022 re:Invent全球大會上宣布推出五項涵蓋數據庫和分析產品組合的全新功能,讓客戶能夠更快、更輕松地管理和分析PB級數據。幾項針對Amazon DocumentDB(與MongoDB兼容)、Amazon OpenSearch Service和Amazon Athena的新功能讓客戶能夠更輕松地大規模運行高性能數據庫和分析工作負載。此外,亞馬遜云科技還發布了Amazon Glue的一項新功能,可以跨數據湖和數據管道自動管理數據質量。最后,Amazon Redshift現在支持跨多個亞馬遜云科技可用區(AZ)的高可用配置。此次發布讓客戶能夠擁有適合其數據工作負載的恰當工具,實現大規模運營并提高可用性,從而幫助客戶充分利用其在亞馬遜云科技上的數據。要了解有關使用亞馬遜云科技釋放數據價值的更多信息,請訪問aws.amazon.com/data。
“數據天生就是動態的,需要端到端的數據戰略來充分發揮其潛力。數據戰略應該能夠根據客戶的需求進行擴展,適應所有類型的用例,兼顧現在和未來。”亞馬遜云科技數據庫、分析和機器學習副總裁?Swami Sivasubramanian表示,“為了幫助客戶充分利用不斷增長的、海量而多樣化的數據,我們一直致力于提供最廣泛和最深入的數據庫和分析服務。在此基礎上,我們今天推出的新功能可以讓客戶更方便地查詢、管理數據和擴大數據規模,更快地做出數據驅動的決策。”
當前,組織創建和存儲的數據達到PB級甚至EB級,數據來源日益多樣化,這其中包括數字媒體、在線交易和各種聯網設備。為了最大限度地發揮這些數據的價值,客戶需要端到端的數據戰略,為所有數據工作負載和應用提供合適的工具,并能在數據體量增大、流速提升時仍能規模化、可靠地執行。為了支持客戶設計自己的端到端數據戰略,亞馬遜云科技提供了業界最全面的數據服務和解決方案,其中包括針對客戶最重要的用例而優化的全托管數據庫,例如用于關系數據庫的Amazon Aurora和用于文檔數據庫的Amazon DocumentDB;還包括可以幫助客戶從數據中獲得有價值的洞察的多種分析服務,諸如面向搜索和分析工作負載(如實時應用監控、日志分析和網站搜索)的Amazon OpenSearch Service、面向交互式分析的Amazon Athena?、面向數據集成的Amazon Glue?和面向數據倉庫的Amazon Redshift。此次發布在這些服務的基礎上提供高級功能。
Amazon DocumentDB Elastic Clusters以每秒數百萬次寫入的性能為PB級應用提供支持。數以萬計的客戶使用?Amazon DocumentDB運行文檔工作負載,因為它速度快、可擴展、高度可用而且完全托管。雖然每個?Amazon DocumentDB節點最多可擴展到64TB數據并支持每秒數百萬次讀取請求,但有一部分客戶的工作負載要求極高,需要超越這些限制的擴展能力,以支持每秒數百萬次寫入并存儲PB級數據。以往,這些客戶必須在多個Amazon DocumentDB節點間手動分拆數據、管理容量。Amazon DocumentDB Elastic Clusters允許客戶在幾分鐘內擴展,打破單個數據庫節點的限制,以支持每秒數百萬次的讀寫并存儲高達2 PB的數據。隨著工作負載需求不斷增加,Amazon DocumentDB Elastic Clusters可以利用分布式存儲系統自動將大型數據集劃分到多個節點。客戶不再需要編寫自定義代碼分拆數據集和跨節點手動管理容量。底層基礎設施自動管理,客戶可以根據需要輕松擴展容量,無需配置、擴展或管理數據庫集群。要了解有關Amazon DocumentDB Elastic Clusters的更多信息,請訪問aws.amazon.com/documentdb/features/#elastic_clusters。
Amazon OpenSearch Serverless自動擴展搜索和分析工作負載。數以萬計的客戶使用Amazon OpenSearch Service支持網站搜索和實時應用監控等用例,這其中許多工作負載由于經常出現間歇性使用高峰使得提前規劃容量非常困難。Amazon OpenSearch Serverless可以自動置備、配置和擴展OpenSearch基礎設施,即使對不可預測和間歇性的工作負載,也可以提供快速數據注入的能力以及毫秒級的查詢響應。借助?Amazon OpenSearch Serverless,數據注入和搜索資源可以獨立擴展,兩種操作并發運行而不會影響性能。使用?Amazon OpenSearch Serverless的客戶可以獲得無服務器帶來的優勢(如自動配置、按需擴展和按使用付費定價等),還可以獲得Amazon OpenSearch Service的功能(如內建的數據可視化)用以理解日志數據、識別異常、查看搜索相關性排名。要了解有關Amazon OpenSearch Serverless的更多信息,請訪問aws.amazon.com/opensearch-service/features/serverless。
Amazon Athena for Apache Spark將交互式分析的啟動時間縮短到1秒以內。客戶使用無服務器交互式查詢服務Amazon Athena。它使用標準SQL接口在Amazon Simple Storage Service(Amazon S3)查詢數據,是查詢PB級數據最方便、最快的方式之一。很多客戶在使用Apache Spark時也希望有同樣的易用性(Apache Spark是一種開源處理框架,用于支持Java、Scala、Python和R等流行語言框架的大數據工作負載)。開發人員雖然很喜歡Apache Spark的快速查詢速度和易用性,但他們不想在每次運行查詢時都花時間搭建、管理和擴展Apache Spark基礎設施。現在,使用Amazon Athena for Apache Spark,客戶已無需自己置備、配置和擴展資源。交互式Apache Spark應用的啟動時間不到1秒,執行速度比跑在亞馬遜云科技優化版Spark runtime上的開源方案更快。由于Amazon Athena與其他亞馬遜云科技服務的集成,客戶可以從多個來源查詢數據,將運算串連在一起進行復雜分析,并且將結果可視化。Amazon Athena for Apache Spark會根據應用需求自動確定所需的資源,并且按需擴展,因此客戶只需為他們運行的查詢付費。要開始使用面向Apache Spark的Amazon Athena,請訪問aws.amazon.com/athena/spark。
Amazon Glue Data Quality自動監控和管理數據的時效性、準確性和完整性。成千上萬客戶使用Amazon Glue快速、輕松且經濟高效地構建和管理現代數據管道。組織需要監控其數據湖和數據管道中信息的數據質量(衡量數據的時效性、準確性和完整性),在確保數據的高質量之后再將其用于分析或機器學習應用。但數據質量管理是一個耗時且復雜的過程,需要數據工程師花費數天時間收集數據的詳細統計數字,根據這些統計數字信息手動識別數據質量規則,并將其應用于數千個數據集和數據管道。在這些規則被付諸實施之后,數據工程師還必須持續監控數據中的錯誤或變化并對規則進行相應的調整。Amazon Glue Data Quality可以自動測量、監控和管理Amazon S3數據湖和Amazon Glue數據管道的數據質量,將數據分析和規則識別的時間從幾天縮短到幾小時。Amazon Glue Data Quality可以計算客戶數據集的統計數字(如最小值、最大值、直方圖和相關性),使用統計數字自動地推薦規則,確保數據的時效性、準確性和完整性。客戶可以安排Amazon Glue Data Quality在數據發生變化時定期運行,自動分析數據并提出質量規則的更改建議以確保相關性。一旦出現質量問題,數據工程師無需編寫代碼即可配置用戶提醒或終止數據管道。要了解有關Amazon Glue Data Quality的更多信息,請訪問aws.amazon.com/glue/features/data-quality。
Amazon Redshift現已支持多可用區部署。數以萬計的亞馬遜云科技客戶每天使用Amazon Redshift處理總計達EB級的數據。為了支持這些客戶的關鍵任務工作負載,Amazon Redshift提供了很多增加可用性和可靠性的功能,例如自動備份以及在幾分鐘內將集群重新在另一個可用區拉起的能力。當前,許多數據庫使用主備復制模式來保證高可用性,單數據庫為在線流量提供服務,備用副本從在線版本復制數據以備不時之需。在這些功能的基礎上,Amazon Redshift現在提供新的高可用配置功能以實現快速恢復,同時最大限度地降低數據丟失風險。借助Amazon Redshift多可用區功能,客戶可以跨多個可用區部署集群,并且使用所有資源處理讀寫查詢,取消低利用率的備用副本,最大限度地提高性價比。客戶仍然可以像管理單個Amazon Redshift數據倉庫那樣,在一個端點管理多可用區數據倉庫,無需更改應用即可保持業務連續性。要了解有關Amazon Redshift多可用區的更多信息,請訪問aws.amazon.com/redshift/reliability。
riskCanvas是Genpact提供的一種軟件即服務(SaaS)產品,是一種金融犯罪合規解決方案。它利用前沿的大數據、自動化和機器學習技術幫助客戶保障合規,提高效率,實現自動化。“riskCanvas?的實體中心監控產品包含了對交易監測、外部資源、監測列表篩選和負面新聞的分析并自動評估風險,僅在客戶的真實風險超過預定義閾值時提醒高風險客戶,從而大大減少了滿足合規要求的工作量。這需要大量的、多樣化的分析處理,通常會遇到峰值和不可預測的數據負載。”riskCanvas?首席技術官兼Genpact金融犯罪技術副總裁Ryan Skousen表示,“我們很高興可以使用Amazon OpenSearch Serverless。它可以自動擴展,滿足我們工作負載的數據注入和分析處理需求,并可以隨著需求的減少而縮減規模,大幅降低成本,所有這一切都不需要重新設計或維護。”
美國金融業監管局(FINRA)是美國一個面向公眾開展業務的證券公司監管機構,負責監管股票、債券和期權交易。“FINRA在Amazon Athena上開發應用,使分析師和業務合作伙伴能夠安全地查詢每天更新的數TB金融交易數據。”FINRA?高級主管Ratnakar Korem表示,“我們很高興看到Amazon Athena for Apache Spark的發布。它將把我們在使用Amazon Athena過程中非常滿意的分析速度和易用性體驗帶到我們的按需分析和批處理分析。這種無服務器功能將使FINRA能夠對大數據進行分析,不需要花精力明確定義計算資源和調整Apache Spark性能。這最終有助于監管用戶和數據分析師快速響應不斷變化的市場動態,節省時間和成本。”
美國聯合航空公司經營著龐大的國內和國際航線網絡,橫跨美國和所有六大洲的大小城市。“聯合航空公司正在為客戶和員工構建數百個數據和分析驅動的工具,管理和維護數據質量對我們的運營至關重要。”聯合航空公司數據工程總監Sarang Bapat表示,“我們很高興使用Amazon Glue Data Quality。它將使我們能夠在幾分鐘內自動識別和分析數據質量問題并采取行動,幫助我們做出明智、及時和準確的決策,并且節省大量花在手動定位和修復各種數據問題上的時間。”
楊森制藥(Janssen Pharmaceuticals)是強生公司的子公司,致力于研究和生產藥品,重點關注患者和醫療保健行業不斷變化的需求。“楊森制藥使用Amazon Redshift實現關鍵的洞察,賦能數據科學家、數據管理員、業務用戶和外部利益相關者做出重要的業務決策。”強生旗下楊森制藥信息技術總監Shyam Mohapatra表示,“Amazon Redshift的多可用區功能可以確保我們的數據倉庫隨時可用,確保我們可以及時做出重要業務決策。”
您可能也感興趣:
為您推薦
遼寧擴大緩繳社保費政策實施范圍 補繳期間免收滯納金
增額終身壽險成銀保市場上的黑馬 中途退保恐會損失保費
保險公司紛紛探索轉型之路 聚焦細分業務、推出新產品
排行
最近更新
- 亞馬遜云科技推出五項數據庫和分析服務功能,提高PB級數據處...
- 修正葛根姜黃飲品|上海修元養正集團全面信息都在這里
- 由輕變重!業之峰的“2022高質量發展年”
- 優樂美奶茶和可樂哪個要胖人?
- 世界快資訊:怎么能有效去除衣服上的靜電
- 全球消息!胖子適合燙發嗎?
- 每日熱文:長胖喝什么奶茶好?
- 焦點簡訊:為什么有些人喝奶茶不會長胖?
- 全球即時看!Nansen創始人:2023年將是針對加密初創公司的一...
- 環球快看點丨潁淮農商銀行:黑心商販玩“調包”,銀行員工巧識破
- 世界微動態丨數據:APE質押前三名均為ApeCoin基金會地址,共...
- 北京經開區發布數字經濟10+示范應用場景:支持企業打造數字資...
- 東平農商銀行聚焦“黃河戰略”支持灘區發展上新臺階
- 環球頭條:濟寧市保險行業協會發布銀保渠道業務自律公約
- 全球熱點評!平頂山銀保監分局五舉措推動銀行保險機構高質量發展
- 穆源民族學校工會開展“口腔健康維護”公益講座及義診活動
- 當前消息!育才京杭小學辦了一場青春期心理健康講座
- 是否有兒童止咳藥、兒童退熱藥?亞寶藥業600351回應
- lpr定價是什么意思?lpr利率和央行基準利率有什么區別?
- 【天天播資訊】展望2023年,城投怎么看?
- 電動汽車電池是回收或再利用?兩者都要
- 安森美連續第四年獲評為美國最負責任的企業之一
- 世界快看點丨刀鋒示波器MSO2預見未來,贏得“M&M 2022年度創...
- 競走和跑步的根本區別是什么?競走能減肚子贅肉嗎?
- 蘿卜里外都是紫,叫什么名字?是什么品種?
- 天津沙窩蘿卜怎么吃?
- 焦點要聞:青蘿卜籽怎么區分?
- 天津的沙窩蘿卜好還是葛沽蘿卜好?
- 沙窩蘿卜的種植深度?
- 天天熱議:報告:美國、韓國、俄羅斯中心化交易所訪問量最大
今日要聞
- 修正葛根姜黃飲品|上海修元養正集團全面信息都在這里
- 由輕變重!業之峰的“2022高質量發展年”
- 亞馬遜云科技推出五項數據庫和分析服務功能,提高PB級數據處理能力
- 全球即時看!Nansen創始人:2023年將是針對加密初創公司的一場大屠殺
- 北京經開區發布數字經濟10+示范應用場景:支持企業打造數字資產流通平臺
- 世界微動態丨數據:APE質押前三名均為ApeCoin基金會地址,共計1220萬枚APE
- 安森美連續第四年獲評為美國最負責任的企業之一
- 【天天播資訊】展望2023年,城投怎么看?
- 世界快看點丨刀鋒示波器MSO2預見未來,贏得“M&M 2022年度創新者”等多個獎項
- 電動汽車電池是回收或再利用?兩者都要