在重重壓力下,Sci-Hub 還是更新了。
科研界女神、Sci-Hub 創始人 Alexandra Elbakyan 今日發了一條推特,立刻引來科研圈的關注。Elbakyan 表示:「 Sci-Hub 更新了,現在用戶可以實時查看下載統計、每月統計等,并在將來會增加更多內容。」
用戶可通過以下兩種方式訪問新版本:
https://sci-hub.se/
https://sci-hub.ru/
https://sci-hub.st/
值得注意的是,這次新版本的 Sci-Hub 連 logo 都更新了,小烏鴉銜著的鑰匙環變成了「錘子和鐮刀」。
新版 Sci-Hub 收集了 88,343,822 份研究論文的數據庫,它們都可以免費下載。就學科而言,這些研究論文涵蓋了醫學、化學、生物學、人類學、物理學、工程學、數學、生態學、計算機學以及地球科學。其中,占比最多的學科是醫學,大約有 2,500 萬,來自醫療與健康期刊。緊接著是化學、生物學、人類與社會學等。
不過,Elbakyan 表示,這些數字都是粗略的,她只能為 Sci-Hub 數據庫中大約 70% 的文章劃分科學領域,并且一些論文被劃分到了不止一個學科。
新版 Sci-Hub 數據庫中各學科的研究論文數量。
就文檔類型而言,大約 80% 是發表在學術期刊上的研究文章、6% 是發表在學術會議上的論文、5% 是書籍章節內容,其余是其他類型的文檔。
就發表日期而言,77% 的文檔發表在 1980 至 2020 年期間,36% 發表在 2010 至 2020 期間。
就覆蓋范圍而言,Sci-Hub 對所有主要科學出版商文章的覆蓋率均超過 95%。
就數據容量而言,Sci-Hub 數據庫大約為 100TB。
與此同時,Elbakyan 還展示了 Sci-Hub 數據庫每年的增長情況。她指出,Sci-Hub 在 2013-2016 年期間增速最快,這是因為需要從期刊檔案中下載舊論文,2016 年之后就只需要下載新論文了。
可以看到,Sci-Hub 的研究論文數量已經從 2013 年的 2,300 萬增長至 2021 年的 8,800 萬,足以說明 Sci-Hub 的受歡迎程度了。
2013 至 2021 年期間,Sci-Hub 數據庫的年增長趨勢。
與此同時,Elbakyan 還統計了用戶從 Sci-Hub 下載論文最多的國家或地區,其中下載數量前三的分別是中國、美國和法國。
Sci-Hub 內容完整列表:https://sci-hub.ru/datasets/dois-2022-02-12.7z
不過,對于 Sci-Hub,網友依然提出了一些疑問。網友 Ansil849 想知道 Sci-Hub 何時才能夠重新開始添加新論文,目前僅用作舊論文的存檔,甚至 2021 年的新論文都無法獲取。雖然知道這肯定與印度的一些起訴案件有關,但不理解為什么這就成為了停止添加新論文的原因以及為什么還沒有啟動添加新論文。
還要網友 @plesk 對 Sci-Hub 數據庫的學科細分提出了一個小問題,「機器學習論文屬于計算機學科、數學還是兩者兼有?」另一網友回復表示,這或許根據具體論文而定,實驗多就劃分在計算機學科、理論多就劃分在數學。
Sci-Hub 的艱難求生之路
Sci-Hub 作為「知識開源領域」的著名網站,由來自哈薩克斯坦 Alexandra Elbakyan 創建。Elbakyan 認為,「期刊付費墻阻礙了科研的進步,讓學術交流變得更封閉、更低效。」于是,2011 年,Alexandra Elbakyan 聯合一些網站搭建起 Sci-Hub,試圖幫助更多的人繞開出版商的付費墻。
Sci-Hub 不僅包含 Elsevier,還提供 Springer、IEEE 旗下期刊、ACS 等出版商的文章,覆蓋范圍廣泛,毫不夸張的說 99% 的付費文章都能在 Sci-Hub 里下載到。
截至目前,Sci-Hub 建立了有 10 年之久,這期間的命運可謂是一波三折,遭到多家出版商的圍剿,不斷被起訴。
早在 2015 年 6 月,Elsevier 就把 Sci-Hub 告上了紐約聯邦法院,指控 Elbakyan 侵犯其版權。當年 10 月,法官裁定 Sci-Hub 侵犯了 Elsevier 期刊內容的版權,要求關閉其在美國的服務器。
2017 年 6 月,美國紐約地區法院宣判,Sci-Hub 須向 Elsevier 賠償高達 1500 萬美元的著作權損失費。
2020 年 12 月,三家大型出版商 Elsevier、Wiley 及其印度子公司和美國化學學會 ACS 以侵犯版權為由將 Sci-Hub 告上印度德里高等法院。
2021 年 1 月,Twitter 封禁 Sci-Hub 賬號,內容被清空。
2021 年 5 月,Alexandra 收到了來自蘋果公司的一封郵件,告知 2 年前她的賬戶數據已經交給了 FBI。
……
不得不說,在創辦 10 年后,Sci-Hub 發展迎來了一段風雨飄搖期。
在出版商的多方圍剿下,很多人都擔心 Sci-Hub 會在一夜之間遭到全面封殺。因此眾多網友發起了 Sci-Hub 救援行動,希望通過拆分內容所有權的方式確保網站內容永久免費,他們把 77TB 論文,轉化成 850 個 BT 種子傳播下去。此外,由于 Sci-Hub 用于接受捐款的 Paypal 賬號被凍結了,無奈之下 Sci-Hub 還發起了捐款行動以進行網站的維護。
不過,這些都沒有阻止 Elbakyan 的努力,也終于迎來了 Sci-Hub 版本的再一次更新。
其他有助于分析科學出版物的數據庫
除了自己的 Sci-Hub,Elbakyan 還介紹了其他幾個同類型的論文數據庫。
第一個是 Crossref 元數據。這個巨量的數據庫通過 DOIs 索引研究論文,并提供論文作者、發表年份、標題和其他相關信息的元數據。該數據庫包含超過 1.2 億條記錄及 API,用戶可以通過 torrents 下載。
網站地址:https://www.crossref.org/
第二個是 General Index。該數據庫可以索引到 1.07 億篇學術論文。
網站地址:https://archive.org/details/GeneralIndex
第三個是 OpenCitations Corpus。這個免費開放的數據庫提供了互引論文的相關信息。
網站地址:https://opencitations.net/corpus
第四個是 Scopus。該數據庫雖然不是免費的,但有免費訪問的科學期刊信息表,用戶在注冊后可以下載。
網站地址:https://www.scopus.com/sources.uri?zone=TopNavBar&origin=searchbasic
第五個是 Scimago Journal & Country Rank。這是一個免費訪問的數據庫,提供了科學期刊論文相關的內容。
網站地址:https://www.scimagojr.com/
希望包括 Sci-Hub 在內的所有這些論文數據庫可以幫助到更多研究者。
參考鏈接:
https://sci-hub.ru/database
https://news.ycombinator.com/item?id=30314601
免責聲明:本網站所轉載的文字、圖片與視頻資料版權歸原創作者所有,如果涉及侵權,請第一時間聯系本網刪除。

官方微信
《中國腐蝕與防護網電子期刊》征訂啟事
- 投稿聯系:編輯部
- 電話:010-62316606-806
- 郵箱:fsfhzy666@163.com
- 中國腐蝕與防護網官方QQ群:140808414