杭州2020年6月9日 /美通社/ -- Nebula Graph V1.0 于6月9日正式發(fā)布,它采用 shared-nothing 分布式架構(gòu),擅長處理千億節(jié)點(diǎn)萬億條邊的海量關(guān)聯(lián)數(shù)據(jù)集,從而更好地服務(wù)企業(yè)級應(yīng)用。Nebula Graph 的設(shè)計(jì)初衷是為了解決企業(yè)應(yīng)用中海量數(shù)據(jù)的實(shí)時(shí)處理問題,相比其他解決方案,它可以更快處理更多的數(shù)據(jù)量,這使得 Nebula Graph 成為業(yè)界領(lǐng)先的高性能圖數(shù)據(jù)庫。
Nebula Graph 是一個(gè)開源的圖數(shù)據(jù)庫,由杭州歐若數(shù)網(wǎng)科技有限公司(下文簡稱:歐若數(shù)網(wǎng))自主研發(fā)維護(hù)。歐若數(shù)網(wǎng)研發(fā)人員來自阿里巴巴、Facebook、華為、IBM 等大廠。
Nebula Graph 優(yōu)勢
Nebula Graph 分布式架構(gòu)能處理的數(shù)據(jù)量遠(yuǎn)大于其他圖數(shù)據(jù)庫。
此外,高可用的分布式架構(gòu)使它在企業(yè)級應(yīng)用中具有在線水平擴(kuò)容、數(shù)據(jù)恢復(fù)特性。
除了分布式架構(gòu),Nebula Graph 獨(dú)創(chuàng)圖查詢語言 -- nGQL。這是一種為圖結(jié)構(gòu)設(shè)計(jì)的類 SQL 查詢語言,有 SQL 使用背景的工程師可快速上手 nGQL。
同時(shí),Nebula Graph 開發(fā)了一款圖數(shù)據(jù)可視化工具 -- Nebula Graph Studio,具備數(shù)據(jù)導(dǎo)入和圖探索功能,可對數(shù)據(jù)進(jìn)行實(shí)時(shí)交互分析,幫助用戶理解圖數(shù)據(jù)結(jié)構(gòu)。
圖數(shù)據(jù)庫市場和應(yīng)用
在過去的2年時(shí)間里,近1.25億美元注入 Nebula Graph 所在的圖數(shù)據(jù)庫行業(yè),資本市場對圖數(shù)據(jù)庫行業(yè)的支持可見一斑。
和 RDBMS 不同,圖數(shù)據(jù)庫不僅存儲(chǔ)數(shù)據(jù)本身,也存儲(chǔ)了數(shù)據(jù)之間的深層關(guān)系。因此,圖數(shù)據(jù)庫可高效地管理萬億級別關(guān)聯(lián)數(shù)據(jù),挖掘數(shù)據(jù)之間的深層關(guān)系,而這恰恰是傳統(tǒng)的關(guān)系型數(shù)據(jù)庫(RDBMS)難以解決的問題。
對 CIO 而言,Nebula Graph 是挖掘現(xiàn)存數(shù)據(jù)關(guān)聯(lián)關(guān)系潛在價(jià)值的絕佳選擇。對希望低成本、高效地處理關(guān)聯(lián)關(guān)系的架構(gòu)師而言,Nebula Graph 也是一個(gè)理想的選擇方案。此外,數(shù)據(jù)科學(xué)家也可用 Nebula Graph 深挖數(shù)據(jù)背后的關(guān)聯(lián)價(jià)值。
現(xiàn)代商業(yè)社會(huì)產(chǎn)生了海量數(shù)據(jù),不同的數(shù)據(jù)儲(chǔ)存在不同的地方,容易形成信息孤島。利用 Nebula Graph,企業(yè)可以打通信息孤島,挖掘數(shù)據(jù)中有意義的關(guān)聯(lián)信息加以利用。例如,在金融領(lǐng)域,可以利用 Nebula Graph 發(fā)現(xiàn)潛在風(fēng)險(xiǎn),預(yù)防團(tuán)伙作案的金融欺詐事件;政府有關(guān)部門也可用于監(jiān)控線上活動(dòng)、機(jī)構(gòu)、賬號(hào)等,第一時(shí)間發(fā)現(xiàn)潛在威脅、應(yīng)對可疑情況。
除了上述場景,還有許多 Nebula Graph 適用場景。通過 Nebula Graph,社交媒體網(wǎng)可將用戶進(jìn)行點(diǎn)對點(diǎn)連接,更好地服務(wù)于他們;在物聯(lián)網(wǎng)(IoT)領(lǐng)域,只有設(shè)備間的關(guān)聯(lián)有意義,才能帶來更大的商業(yè)價(jià)值;線上零售、醫(yī)療保健領(lǐng)域、人工智能(AI)領(lǐng)域,Nebula Graph 也可助力處理、挖掘關(guān)聯(lián)信息。
如何使用 Nebula Graph
目前 Nebula Graph V1.0 已發(fā)布,可基于 Apache 2.0 許可證使用 Nebula Graph。近期 Nebula Graph 將會(huì)提供云上服務(wù)。
用戶寄語
“之前京東數(shù)科的圖服務(wù)是由 JanusGraph 提供的,我們碰到的主要問題是寫入和查詢速度很慢,且社區(qū)不活躍 bug fix 不及時(shí),導(dǎo)致業(yè)務(wù)使用體驗(yàn)不理想。正在尋找新的解決方案時(shí),遇到 Nebula Graph 剛啟動(dòng),所以京東數(shù)科圖技術(shù)團(tuán)隊(duì)立刻就參與了 Nebula Graph 的開源社區(qū),并一起參與和合作開發(fā)了很多功能。借助 Nebula Graph 圖數(shù)據(jù)庫的高性能分布式存儲(chǔ)和查詢能力,從京東數(shù)科海量數(shù)據(jù)集中挖掘重要的關(guān)聯(lián)關(guān)系,很好的助力內(nèi)部和集團(tuán)業(yè)務(wù)的開展。目前,我們正在將更多的圖項(xiàng)目從傳統(tǒng)方案遷移到 NebulaGraph?!?/p>
-- 京東數(shù)科圖技術(shù)團(tuán)隊(duì)負(fù)責(zé)人錢勇
“在接觸 Nebula Graph 之前,我們的圖譜項(xiàng)目已經(jīng)試用過多個(gè)知名的開源圖數(shù)據(jù)庫,包括 Neo4j、JanusGraph、DGraph 這些在 DB-Engine 上排名非常靠前的產(chǎn)品,但在規(guī)模和性能上沒法滿足我們的要求,導(dǎo)致項(xiàng)目一直沒有上線。當(dāng)遇到 Nebula Graph 后,我們發(fā)現(xiàn) Nebula Graph 的架構(gòu)設(shè)計(jì)簡潔可擴(kuò)展,且基于 C++ 開發(fā),性能特別強(qiáng)勁,具備非常強(qiáng)的互聯(lián)網(wǎng)分布式基因;Nebula的同學(xué)們也非常給力靠譜,大家一起解決了N多個(gè)技術(shù)難題,成功把性能提升到遠(yuǎn)超最初規(guī)劃,并且基于公司已有基礎(chǔ)設(shè)施,搭建了一套圖數(shù)據(jù)庫平臺(tái),方便業(yè)務(wù)接入。現(xiàn)在,我們正在通力合作,把更多的知識(shí)圖譜項(xiàng)目遷移到 Nebula Graph 上面來?!?/p>
-- 美團(tuán)點(diǎn)評AI平臺(tái)技術(shù)專家趙登昌
基于圖的風(fēng)控和推薦方案相比傳統(tǒng)方案有很大的技術(shù)優(yōu)勢,通過圖技術(shù)賦予的新能力,我們在業(yè)務(wù)上發(fā)現(xiàn)了很多有意思的增長點(diǎn)。但由于業(yè)務(wù)上對于低時(shí)延、高并發(fā)的要求,我們一直在尋找高性能的開源圖數(shù)據(jù)庫方案。在通過詳盡的比較 Nebula Graph、Neo4j、DGraph、JanusGraph 幾種開源方案后,我們最終選用了 Nebula Graph,是基于這樣幾個(gè)原因:
-- 有贊數(shù)據(jù)基礎(chǔ)平臺(tái)技術(shù)專家陳琦
“基于企業(yè)間關(guān)系的企業(yè)圖譜、供應(yīng)鏈關(guān)系、企業(yè)知識(shí)圖譜這些應(yīng)用都是非常典型的知識(shí)圖譜應(yīng)用,也非常適合使用圖數(shù)據(jù)庫來作為基礎(chǔ)設(shè)施支撐業(yè)務(wù)發(fā)展。最初階段,我們使用了某知名單機(jī)圖數(shù)據(jù)庫的方案,很好的支持了彼時(shí)業(yè)務(wù)的快速擴(kuò)張;但隨著互聯(lián)網(wǎng)式的數(shù)據(jù)量和訪問規(guī)??焖僭黾?,這樣的方案在擴(kuò)展性和時(shí)效性上的問題越來越突出。在得知 Nebula Graph 去年5月份開源后,我們就一直持續(xù)關(guān)注其動(dòng)態(tài),其分布式架構(gòu)很適合我們的業(yè)務(wù)需求,并且迭代速度相當(dāng)快速。在經(jīng)過幾個(gè)月的試用和調(diào)優(yōu)后,Nebula Graph 已經(jīng)在相當(dāng)多內(nèi)部業(yè)務(wù)上替代了原方案;未來,隨著對于 OpenCypher 的兼容,我們計(jì)劃將更多業(yè)務(wù)遷移到 Nebula Graph上?!?/p>
-- 蘇州朗動(dòng)網(wǎng)絡(luò)技術(shù)有限公司(企查查)知識(shí)圖譜算法專家鄭文裕
“I have a graph,a red graph. 小紅書作為一個(gè)在線社區(qū),有著很多的圖存在:用戶和筆記的交互關(guān)系,用戶和用戶的關(guān)注關(guān)系,電商交易關(guān)系等等。關(guān)系型數(shù)據(jù)庫往往不能有效支撐小紅書這樣一個(gè)量級的圖有效存儲(chǔ)和實(shí)時(shí)查詢計(jì)算。筆者接觸過不少圖數(shù)據(jù)庫,一些寄希望于摩爾定律的發(fā)展,其他在性能上達(dá)不到我們的要求。我們選用Nebula圖數(shù)據(jù)庫,首先來自對團(tuán)隊(duì)的信任,創(chuàng)始人和核心成員在Facebook和螞蟻金服,阿里等大公司做過圖數(shù)據(jù)庫,支撐了在線業(yè)務(wù)數(shù)據(jù)流下的推薦、搜索和風(fēng)控等多個(gè)場景,深刻理解數(shù)據(jù)和業(yè)務(wù)形態(tài)以及之上的算法場景和需求,是最熟悉中國一線互聯(lián)網(wǎng)公司圖數(shù)據(jù)庫需求的團(tuán)隊(duì)。其次諸多核心架構(gòu)設(shè)計(jì)保證了對于超大規(guī)模數(shù)據(jù)的支持和集群規(guī)模的可擴(kuò)展性。值得一提的是,對于圖上經(jīng)典的熱點(diǎn)問題,Nebula最早應(yīng)小紅書需求實(shí)現(xiàn)了蓄水池抽樣算法。我們也利用Nebula這個(gè)風(fēng)控底層武器來保護(hù)小紅書社區(qū)這個(gè)Red Graph,同時(shí)也在賦能給我們的其它業(yè)務(wù)算法線?!?/p>
-- 小紅書反作弊風(fēng)控策略算法負(fù)責(zé)人吹雪