王春暉
  大數據的浪潮正在席卷全球。對於法學研究來說,大數據意味著一場新的機遇和挑戰。法學研究領域要張開雙臂熱情擁抱大數據時代的到來。大數據時代,法律數據呈現出數量大、速率快、多樣化、不穩定等特點,大數據正在挑戰傳統法學研究方式,正在向法學領域滲透。
  解析大數據
  何謂大數據,至今尚沒有一個正式和統一的定義,目前最為普遍的定義就是“用傳統方法或工具不能處理或分析的數據”。其他各種不同的定義基本是從大數據的特征出發通過對這些特征的闡述和歸納試圖給出定義。在這些定義中比較有代表性的是3V定義,即認為大數據需滿足3個特點:規模性(volume)、多樣性(variety)和高速性(velocity)。基於以上三大特征,國際數據公司(International Data Corporation,IDC)認為大數據還應當具有價值性(value),大數據的價值往往呈現出稀疏性的特點。
  法學之所以被稱為一門獨立的學科,很大程度上取決於其自身具有一套獨立的方法理論。方法是獲取知識的重要手段,也是理論研究和運用的途徑。然而,隨著大數據時代海量數據的獲得,法律數據分析也呈現多樣性和複雜性的特征,大數據方法的運用對分析法律事件和法律行為正變得愈加重要。法律大數據主要指法律領域出現的大量半結構化和非結構化數據,這主要包括相對於結構化數據而言,不方便用數據庫二維邏輯表來表現的法律數據,比如各種格式的法律文檔、法律文本圖片、標準通用標記語言下的子集XML、HTML、各類與法律相關的圖像和音頻、視頻信息等等。
  法律大數據獨具特色
  法律大數據呈現出具有規模效益、高速性和多樣性數據樣本等特征,這些特征是傳統法律數據處理方法和工具所不具有的。
  法律大數據具有規模效益。法律大數據的規模效益主要指數據量非常龐大,主要體現在數據存儲量大和計算量大。在2006年,個人用戶才剛剛邁進TB時代,全球一共新產生了約180EB的數據。在2011年,這個數字達到了1.8ZB,而有市場研究機構預測:到2020年,整個世界的數據總量將會增長44倍,達到35.2ZB(1ZB=10億TB)。因此,大數據中的數據不再以幾個GB或幾個TB為單位來衡量,而是以PB(1千個TB)、EB(1百萬個TB)或ZB(10億個TB)為計量單位。
  在大數據時代,法律數據的大規模產生使得法學的跨學科研究顯得更為重要。這不僅提醒所有的法律人可以通過對法律大數據的關聯性分析得出社會領域將產生的法律現象,而且要註意法律大數據的關聯性分析也將導致法律現象與政治、經濟、文化、教育等的關係交融在一起,法律大數據可以被看作是根植於一個複雜社會系統環境中的數據基石。也就是說,法律研究者將通過呼叫詳細記錄、智能設備和傳感器信息、GPS地理定位映射的數據、通過管理文件傳輸協議傳送的海量圖像文件、W“b文本和點擊流數據、評價數據、科學信息、電子郵件等等,告訴我們這個社會未來會出現什麼法律現象,會發生什麼法律事件以及如何去應對和處理。
  法律大數據具有高速性特征。一方面是指法律數據在不斷更新,增長的速度快,另一方面是指法律數據存儲、傳輸等處理速度很快,甚至是實時處理。比如對刑事案件發生頻率和時段的預測,需很快地對案件發生的程度、影響的區域範圍等進行量化。甚至在犯罪嫌疑人實施犯罪之前,就可以運用大數據對可能發生的犯罪行為作出預判。目前,在美國許多城市(比如紐約、洛杉磯和里士滿)以及其他一些國家都在使用軟件處理過往的犯罪數據及其他數據。通過這種措施來預測哪些區域的犯罪率更高,並提前派出更多警車到這一區域巡邏。運用軟件處理數據的效果令人印象深刻,與不使用軟件分析的周邊地區相比,採用這種措施的地區犯罪率大幅下降。當然,目前還是以判斷發生罪案的地點為主,而未來發展的方向則是要發現誰會成為罪犯,甚至直接通過大數據分析鎖定某個犯罪嫌疑人個體。
  法律大數據具有多樣性數據樣本的特征。法律大數據的數據包含結構化的數據表和半結構化、非結構化的文本、視頻、圖像等信息,而且數據之間的交互非常頻繁和廣泛,具體包括三個方面:一是數據來源多。目前的法律數據主要是法律數據庫能夠處理的數據,而移動互聯網和物聯網的發展,帶來了諸如微博、社交網站、GPS定位、傳感器等多種法律數據的來源;二是數據類型多,並且以非結構化數據為主。傳統的法律數據中,數據都是以文檔和表格的形式保存。而法律大數據中70%至85%的數據是如圖片、音頻、視頻網絡日誌、定位信息、鏈接信息等非結構化和半結構化的數據;三是數據之間關聯性強,且頻繁交互。如一個犯罪嫌疑人在途中上傳的照片和日誌,就與該犯罪嫌疑人的位置、行程等信息有了很強的關聯性。
  法律大數據研究將成為新領域
  法律大數據及其應用的迅速發展,已經引起了法律界的關註,法律人已經從各種不同的視角對於這場大變革進行著思考和議論。法律大數據的研究也將成為法學研究的一個創新型領域。
  展望一:法律數據的資源化。所謂資源化,是指法律大數據將成為法律人和法學研究跨社會領域關註的重要戰略資源,並將成為法律界爭相搶奪的新焦點。因而,法學研究領域應當制定法律大數據研究的戰略計劃,將法律大數據的研究成果融入到社會的各個領域。
  展望二:法律大數據與法律雲將深度結合。法律大數據離不開雲處理,雲處理為法律大數據提供了彈性可拓展的基礎設備,是產生法律大數據的平臺之一。自2013年開始,大數據技術已開始和雲計算技術緊密結合,預計未來兩者關係將更為密切。為此,建議司法部門聯合建立中國法律大數據及法律雲平臺,更好地發揮法律大數據和法律雲在國家安全和網絡空間安全以及在經濟和社會發展中的重要作用。
  展望三:大數據將改變法學研究的範式。法學不是嚴格意義上的科學,法學意義中的真理只是一些基於多數人利益的社會共識,法學研究方法應當服從於法學的內涵。儘管因法學的調整範圍、調整對象和調整方法的特殊性使法學研究方法具有自己的特色,但法學研究方法如果不與其他科學研究的方法相結合,法學研究方法便失去了存在的意義。過去幾個世紀主宰科學研究的方法一直是“還原論”,將世界萬物不斷分解到最小的單元,然而這種方法作為一種科研範式將走到盡頭,因為對單個人、單個基因、單個原子等瞭解越多,對整個社會、整個生命系統、物質系統的理解並沒有增加很多,有時可能離理解系統的真諦更遠。
  隨著大數據的快速發展,就像計算機和互聯網一樣,法律大數據很有可能是一場法律研究範式的革命。法律人的思維也將發生革命性的轉變,即不再探求難以捉摸的法律因果關係,轉而關註社會複雜事物的相關關係。筆者預計,法律大數據將催生一種新型的法律職業——法律數據分析師,而且具有豐富經驗的法律大數據分析人才將可能成為法律研究、法律應用、法律服務和法律輔助領域的稀缺資源,法律大數據將驅動法學研究、法律應用和法律服務的轉型。隨之興起的數據挖掘、機器學習、人工智能和3D打印等相關技術,可能會改變數據世界里的很多計算方法和基礎理論,而這也將使得法學研究的對象和方法由傳統的1.0時代向2.0時代跨越。
  (作者為南京郵電大學信息產業發展戰略研究院院長)  (原標題:開啟:法學研究新領域)
創作者介紹

stanley kubrick

ldvxnhuwespe 發表在 痞客邦 PIXNET 留言(0) 人氣()