除了猴子圖片難以想象的價格之外, NFT 的底層技術為公司提供了一條直接將其在線業務盈利的新途徑。主要品牌,如: 阿迪達斯 , 美國籃球職業聯盟 和 TIME?我們已經開始使用非金融交易系統對這些收入流進行實驗——我們還處于這一趨勢的早期。
作為數據從業者,鑒于所有交易在區塊鏈上都是公開的,我們將為這些收入流提供有價值的見解。這篇文章提供了一個引導項目,使用 Python 訪問、分析和識別使用區塊鏈數據的潛在欺詐。
在這篇文章中 隨附 Jupyter 筆記本 為此,我將討論以下內容:
- 區塊鏈、 NFT 和網絡圖的基礎知識。
- 如何使用來自 a16z 的開源軟件包 NFT Analyst Starter Pack 提取 NFT 數據。
- 如何解釋以太坊區塊鏈數據。
- 非金融交易的欺詐行為。
- 構建網絡圖,以可視化 NFT 項目 Bored Ape 游艇俱樂部的潛在清洗交易。
Jupyter 筆記本有一個更詳細、分步的指南,用于編寫 Python 代碼來實現這個示例演練,本文提供了額外的上下文。此外,本文假設您對以下內容有基本了解: pandas?、數據準備和數據可視化。
什么是區塊鏈數據?
在以狗命名的硬幣和像素化圖片以數十萬美元的價格出售的媒體熱潮中,我們發現了一種迷人的技術:區塊鏈。
以下摘錄最能描述這種分散的數據源:
“在非常高的層次上,區塊鏈是利用加密技術的交易分類賬,只能添加信息,因此無法更改(即不變)。將區塊鏈與銀行賬本區分開來的是一個稱為“去中心化”的概念,即連接到各個區塊鏈的每臺計算機必須“同意”區塊鏈的相同狀態以及添加到其中的后續數據。”
有關以太坊區塊鏈數據的更多信息,請參閱 利用以太坊數據進行分析 .
這項技術的核心是所有數據(例如,日志、元數據等)都必須是公共的和可訪問的。我強烈推薦斯坦福大學教授 丹·博內的閱讀 .
什么是 NFT ?
NFT 代表不可替代代幣,區塊鏈(如以太坊)上的加密資產,其中它代表可以數字擁有的唯一令牌。例如,金條是可替代的,因為多個金條可以存在并代表同一件事,而蒙娜麗莎原作是不可替換的,因為只有一個金條存在。
與普遍的看法相反, NFT 不僅僅是藝術和 JPEG ,而是區塊鏈賬本上唯一項目所有權的數字表示,如藝術、音樂,或 NFT 創建者想要放在元數據上的任何東西。然而,在這篇文章中,我們使用了 NFT 項目 Bored Ape Yacht Club ( BAYC ),這是一個藝術品 NFT 。
P 、 如果你是一名視覺學習者,我最喜歡的關于 NFT 主題的介紹資源是 什么是非金融交易?如何將其用于分散金融?迪菲解釋道 Finematics 的視頻。
什么是網絡圖,為什么它們代表區塊鏈數據?
網絡是一種組織關系數據的方法,使用節點和邊緣.節點表示實體,如電子郵件地址或社交媒體帳戶,而邊緣表示節點之間的連接。
此外,可以存儲節點和邊的元數據,以表示關系的不同方面。元數據的范圍可以從權重到標簽。圖 1 顯示了獲取整個網絡并使用元數據中的有用標簽放大到用例的步驟。
使網絡圖成為表示區塊鏈交易的理想工具的是,始終存在一個到和從…起區塊鏈地址,以及每個交易的重要元數據(例如,時間戳、硬幣金額等)。此外,由于區塊鏈數據通過分散設計是公開的,因此您可以使用網絡圖來可視化各個區塊鏈上的經濟行為。
在本例中,我想演示如何識別洗牌交易也就是說,個人故意通過多個賬戶向自己出售資產,以人為抬高資產價格。
ChainAnalysis 寫了一份出色的報告 關于這一現象,他們發現了 260 多個以太坊加密錢包可能參與洗牌交易,僅 2021 一年的總利潤就超過 840 萬美元。
從以太坊區塊鏈中提取數據
盡管所有區塊鏈數據對任何人都是公開的,但訪問和準備分析仍然很困難。以下是訪問區塊鏈數據的一些選項:
- 創建您自己的區塊鏈節點(例如,成為礦工)以讀取可用的最原始數據。
- 使用第三方工具創建您自己的區塊鏈節點。
- 使用第三方 API 從自己的區塊鏈節點讀取原始數據。
- 使用第三方 API 從其服務讀取清理和聚合的區塊鏈數據。
- 使用開源軟件包 NFT 分析師入門包 從 a16z 開始。
盡管所有這些都是可行的選擇,但每種選擇都在可靠性、信任和便利性之間進行權衡。
例如,我參與了一個 NFT 分析項目,我們希望創建一個可靠的 NFT 市場儀表盤。不幸的是,擁有我們自己的區塊鏈節點成本高昂,許多第三方數據源存在我們無法控制的各種數據質量問題,因此跨多個區塊鏈跟蹤交易變得非常困難。該項目最終需要匯集來自眾多第三方 API 的高質量數據。
謝天謝地,對于這個項目,您希望盡可能方便地專注于學習,因此我推薦您 來自 a16z 的 NFT 分析師入門包 .將此軟件包視為第三方區塊鏈 API 的方便包裝 Alchemy?,它可以為您所需的 NFT 合同創建易于使用的 CSV 。
準備數據和創建網絡圖
NFT Analyst Starter Pack 為 BAYC NFT 項目生成了三個單獨的 CSV 文件:
- 貝葉斯元數據:關于特定 NFT 的信息,其中
asset_id
是該 NFT 令牌內的唯一標識符。 - BAYC 銷售:與特定交易相關的日志和元數據,由其交易哈希表示,其中賣方和買方通知您所涉及的錢包。
- BAYC 傳輸:與 BAYC 銷售數據相同,但沒有資金從一個錢包轉移到另一個錢包。
對于本項目,大部分數據準備工作圍繞著:
- 重新組織 BAYC 銷售和 BAYC 傳輸,以實現兩個數據集的干凈合并。
- 刪除已在銷售中表示的轉賬交易的重復日志。
鑒于目標是學習,不必擔心區塊鏈數據是否準確,但您始終可以通過搜索上的transaction_hash
值來檢查自己 Ethercan?.
準備好數據后,使用 NetworkX 軟件包 生成 NFT 事務的網絡圖數據結構。構造圖有多種方法,但在我看來,最直接的方法是使用函數from_pandas_edgelist
,其中,您只需提供 pandas 數據幀、to
和from
值來表示節點,以及用于邊緣和標簽的任何元數據。
[('0x2fdcca65899346af3a93a8daa6128bdbcb1ce3b3',
'0xcedf17dfafa947cd0e205fe2a3a183cf2fb3a0bc',
{'transaction_hash': '0xb235f0321b0b50198399ec7f2bb759ef625f85673b4d90d68f711229750181e4',
'block_number': '14675897',
'date': '2022-04-28',
'asset_id': '7438',
'sale_price_eth': 153.2,
'sale_price_usd': 442685.5285671361,
'transaction_type': 'sell',
'asset_contract': '0xbc4ca0eda7647a8ab7c2061c2e118a18a936f13d'}),
('0x2fdcca65899346af3a93a8daa6128bdbcb1ce3b3',
'0xd8fdd6031fa27194f93e1a877f8bf5bfc9b47e1e', {'transaction_hash':'0x7b4797061eb16d73a28a869e51745e471e2849a55c80459b2aff7f0205925d74',
'block_number': '14654313',
'date': '2022-04-25',
'asset_id': '5954',
'sale_price_eth': 0.0,
'sale_price_usd': 0.0,
'transaction_type': 'transfer',
'asset_contract': '0xbc4ca0eda7647a8ab7c2061c2e118a18a936f13d'})]
根據這些準備好的數據, NetworkX 軟件包使可視化網絡圖與nx.draw
一樣簡單,但在數據幀中有超過 4 萬個事務,可視化整個圖只會返回一個無用的 blob 。因此,您必須明確在您的事務中可視化什么,以創建一個引人入勝的數據故事。
可視化潛在的清洗交易
您可以驗證市場上其他人的陳述,而不是瀏覽 10000 筆非金融交易。值得注意的是 NFT Wash Trading – Is it possible to protect against it? 《華盛頓郵報》稱, BAYC token 8099 可能受到洗牌交易欺詐行為的影響。
如果您按照隨附筆記本中的說明進行操作,則執行以下步驟:
- 僅將準備好的 NFT 數據篩選到包含
asset_id
8099 日志的行。 - 將
to
和from
錢包地址重命名為大寫字母,按錢包地址首次出現在非金融資產交易中后的順序排列。 - 使用 NetworkX 包使用準備好的資產 8099 數據生成網絡圖數據。
- 使用所需的標簽、邊箭頭和節點定位繪制網絡圖。
BAYC 8099 NFT 是否經歷過清洗交易?
圖 2 中繪制的數據使您能夠可視化與資產 8099 相對應的數據H,您可以看到,這款錢包首先將價格從 9.5 萬美元提高到了 16.6 萬美元H < – > I也就是說,然后通過之間的傳輸添加更多事務H < – > J最后H向節點出售可能人為增加的 NFTK.

盡管該圖不能確定該節點的狀態H從事洗牌交易,因為你不知道是否H,我和J同一個人擁有的錢包在某個節點上出現循環,價格上漲應表明需要進行更多的盡職調查。例如,您可以查看 etherscan.com 要查看以下錢包之間的交易:
0xe4bc96b24e0bdf87b4b92ed39c1aef8839b090dd
(節點H).0x7e99611cf208cb097497a59b3fb7cb4dfd115ea9
(節點我).0xcbc9f463f83699d20dd5b54be5262be69a0aea9f
(節點J).
也許是節點H有賣家的悔恨,希望他們的非金融交易能回來,因為投資者對他們鐘愛的非金融工具產生依戀并不少見。但是與節點相關聯的錢包之間存在大量交易H,我和J可能指示 NFT 資產的進一步危險信號。
下一步
通過跟隨本帖子和隨附的 筆記本 ,您已經了解了如何通過網絡圖訪問以太坊區塊鏈數據和分析 NFT 。如果您喜歡這個分析,并且對做更多類似的項目感興趣,請在 CharlieDAO Discord 平臺與我交流,這也是我常去的地方。我們是探索 web3 的軟件工程師、數據科學家和加密本地人的集合!
免責聲明
本內容僅用于教育目的,不是財務建議。在發布筆記本的那一刻,我與分析過的 NFT 沒有任何財務聯系,這是我的 Etherscan 上的加密錢包地址 以供參考。該分析僅強調了潛在的欺詐行為,以進行進一步調查,但不能證明欺詐行為已經發生。最后如果你擁有加密軟件,切勿與任何人共享您的“秘密恢復短語”或“私鑰”。
?