- Convenor:
-
Makoto Goto
(National Insitututes for the Humanities)
Send message to Convenor
- Format:
- Panel
- Section:
- Interdisciplinary Section: Digital Humanities
Short Abstract
This session presents developments in historical research in Japan driven by AI and data-oriented approaches within Digital Humanities. It highlights research infrastructures and AI practices in Japan, and discusses how these initiatives open new avenues for cooperation with scholars worldwide.
Long Abstract
Recent years have seen notable new developments in historical research in Japan, influenced by broader trends in Digital Humanities and a growing interest in the possibilities of Digital History. These developments reflect efforts to rethink historical research not only through the adoption of new tools, but also through the creation of research environments and collaborative frameworks that reshape the production and circulation of historical knowledge.
Central to these changes is the establishment of large-scale research infrastructures in Japan based on AI and data-driven methodologies. Through the continuous accumulation, management, and sharing of digitized historical sources—such as document images and related datasets—researchers are constructing data infrastructures capable of addressing the diverse historical experiences associated with the Japanese archipelago. In parallel, AI-based analytical techniques, including information extraction, classification, and relational analysis, are being developed to support quantitative and cross-sectional approaches to historical materials.
Within this framework, regionally based archives play an especially important role. They make visible historical materials that have previously remained underutilized visible, while also serving as key sites connecting local communities with academic research. By incorporating regional archival resources into broader digital infrastructures, historical questions can be reframed across periods, regions, and thematic domains, while maintaining close engagement with locally grounded sources.
Alongside infrastructural development, increasing attention is increasingly being paid to renewing historical expertise through both theoretical and practical collaboration between history and information science. The use of computers and AI supports digitization, visualization, and public dissemination, fostering collaborative research environments that involve not only historians but also interdisciplinary partners and citizen participants. This session examines how AI- and data-driven research environments emerging AI in Japan are reshaping historical methodology, and considers their implications for collaboration with scholars worldwide within the broader context of Digital Humanities.
| Abstract in Japanese (if needed) | 日本の歴史学研究に関して、新たな動きが進みつつある。それは、Digital Humanities の動向を受けつつ、新たに Digital History の可能性を追求しようというものである。 それらの動きを支えているのは、AI やデータ駆動型手法の活用を前提とした大規模な研究環境の整備である。史料の画像データや関連データを継続的に蓄積・管理・共有することによって、日本列島の多様な過去の事象に関わるデータインフラストラクチャの構築を目指す取り組みが進められている。また、AI を用いた情報抽出・分類・関連検出などのデータ分析基盤の構築を通じて、日本資料の量的な分析や異分野間の知識刺激を可能とする研究環境の形成が目指されている。とりわけ、地域に根ざしたアーカイブは、これまで十分に可視化されてこなかった多様な歴史資料を掘り起こし、地域社会と学術研究を結びつける重要な基盤として、重要な役割を果たしつつある。こうしたデータ基盤の構築と分析手法の確立は、多様な時代・地域・テーマを横断しながら歴史的問いを立て直す基盤となりつつある。 さらに、歴史学の専門性の更新を目指す動きとして、歴史学と情報学の協働の理論化と実践が進められている。ここでは、コンピュータや AI を活用することで、資料のデジタル化・可視化・公開を推進し、専門の研究者だけでなく学際的連携や一般市民参加型の共同研究環境を整備することが試みられている。また、AI による自動翻刻や固有表現抽出といった技術を用いることで、歴史資料の分析過程における再現性の確保や、新たな分析手法を見出すことで、「専門家中心の研究」から「チーム型の歴史学」への転換が図られている。こうした取り組みは、歴史学の根本的な方法論と知の構造そのものを問い直し、再認識する契機となっている。 本セッションは、こうした AI・データ駆動型の歴史研究環境と協働の試みを出発点として、日本における歴史学の方法論的革新と国際的連携の可能性を議論する場を提供することを目的とする。 |
Accepted papers
Paper short abstract
This presentation examines digital history initiatives in Ryukyu-Okinawa, emphasizing community collaboration, regional archives, and shared data infrastructures. It shows how Digital Humanities practices emerging from Japan are reshaping historical research and fostering cooperation worldwide.
Paper long abstract
This presentation examines recent trends in digital history in Japan, focusing on data infrastructure development in Ryukyu-Okinawa and the emerging possibilities for historical practices involving citizens and transdisciplinary researchers. Ryukyu-Okinawa studies face a tragic historical background: fundamental materials, including the Rekidai Hōan(歴代宝案), were lost due to the Great Kanto Earthquake and the Battle of Okinawa. Recent collaborative efforts between academia and Okinawa Prefecture have advanced the digitization of scattered materials and the development of data infrastructure for aerial photographs and documents related to USCAR and the Government of the Ryukyu Islands. The endeavor to continuously accumulate and manage lost historical materials across national borders and regions, and to reconstruct them as a data infrastructure accessible to everyone, holds significant social value not only in contributing to the development of historical research, but also in creating a foundation for local community identity.
These developments extend beyond digital archives. AI-based automatic transcription for Ryukyu Kingdom documents and GIS spatial analysis enable quantitative analysis of governance structures and trade networks, which was previously difficult to achieve. The reconstruction of Okinawan immigrant family networks complements historical narratives from micro and macro perspectives. Current archiving encompasses official documents, images,local dialects, Traditional Ecological Knowledge for medicinal plants, folktales, oral testimonies, personal diaries, field notes and material objects. Integrating these diverse materials on public platforms expands the concept of historical materials while opening historical practice to diverse actors beyond specialized researchers.
This presentation introduces concrete initiatives to uncover buried local materials with community members. These efforts demonstrate transformation from "history as described" unilaterally by experts to " Historical Practice" as the participatory research. Data-driven approaches based on accumulated diverse materials renew the "Ryukyu within Asia" perspective and create transdisciplinary environments involving the citizens, humanities, social sciences, and natural sciences. The Ryukyu-Okinawa case demonstrates that digital historical reconstruction represents a pioneering "team-based historiography" model closely connected to contemporary regional issues and identity formation, rather than the mere reproduction of the past.
These practices exemplify how Digital Humanities frameworks enable new forms of historical knowledge production that integrate regional archives, computational methods, and collaborative research environments.
| Abstract in Japanese (if needed): | 本報告では、近年の日本におけるデジタルヒストリーの潮流を踏まえ、琉球沖縄地域におけるデータ基盤の整備と、そこから新たな広がりを見せる市民や異分野の研究者が参画する歴史実践の可能性を論じる。琉球沖縄研究においては、関東大震災や沖縄戦によって「歴代宝案(REKIDAIHOUAN)」をはじめとする基幹史料が焼失・散逸したという痛ましい歴史的背景がある。これに対し、近年、国内外に散逸した史料のデジタル化に加え、戦中・戦後の空中写真、米国民政府(USCAR)および琉球政府関連の行政文書等のデータ基盤整備が、官学一体となって進展している。失われた史料を国境や地域を越えて継続的に蓄積・管理し、誰もがアクセス可能なデータインフラとして再構築する試みは、歴史学の研究展開に寄与するだけではなく、地域住民のアイデンティティの拠り所を創出するという点において、極めて大きな社会的意義を有している。 こうした動向は、単なる資料のデジタルアーカイブ化に留まらない。琉球王朝時代の文書史料に対するAIを用いた自動翻刻技術の導入や、地理情報システム(GIS)による空間分析の活用は、従来の手法では困難であった広域的な統治機構や交易ネットワークの定量的分析を可能にした。さらに、近代以降の沖縄系移民の家族ネットワークの復元など、ミクロとマクロの両面からの歴史記述を補完しつつある。現在、沖縄で進められているアーカイブ化の対象は、公文書や画像データのみならず、島ことば、薬用植物などの民俗知、民話や証言といったナラティブ・データ、さらには個人の日誌や研究者のフィールドノート、もの資料まで多岐にわたる。これらがパブリックな基盤の上に統合されつつある現状は、歴史資料の概念を拡張させるとともに、歴史実践の担い手を専門の研究者に限定せず、多様なアクターへと開いていると言えるだろう。 本発表では、報告者が専門とする文化人類学的知見に基づき、地域住民と共に埋もれた多様な地域歴史資料を掘り起こす具体的な取り組みを紹介する。そこでは、専門家によって一方的に「記述される歴史」が、市民や異分野の研究者が主体的に参画する「歴史実践」へと変容するプロセスが示される。蓄積された多様な地域史料に基づくデータ駆動型アプローチは、「アジアの中の琉球」という国際的視座を更新し、市民や人文・社会科学のみならず自然科学をも巻き込んだ超学際的な共同研究環境を創出している。結論として、琉球沖縄の事例は、デジタル技術を用いた「歴史の再構築」が、単なる過去の再現ではなく、現代の地域課題やアイデンティティ形成と密接に結びついた「チーム型の歴史学」の先駆的モデルであることを提示する。本報告を通じて、日本におけるDHの革新性が、いかに地域社会の再生と国際的な研究連携に寄与し得るかを考察したい。 |
Paper short abstract
This paper presents a method for extracting the written contents from historical sources using GenAI. Focusing on Latin epigraphy, it outlines a workflow for extracting and representing them as an RDF-compliant knowledge graph, while highlighting issues of evaluation and quality control.
Paper long abstract
Recent rapid advances in generative AI are significantly transforming approaches to knowledge structuring and information discovery in the study of historical sources. Beyond the metadata traditionally accumulated for such materials, it is becoming increasingly possible to extract concrete semantic content embedded in the sources themselves, including events, relationships, and contextual situations. Although attempts to structure the internal content of historical sources predate the emergence of generative AI, the automatic extraction of diverse and complex information from natural language texts has generally been difficult, requiring extensive manual labor and thus limiting the scale of such efforts.
Generative AI, with its strong capacity for contextual understanding, has the potential to overcome these limitations by extracting fine-grained and usable knowledge from a vast corpora of historical materials that exceed the limits of human reading alone. Some initiatives, in fact, have already produced notable results, including domestic projects that construct knowledge graphs from the Saga texts using generative AI, as well as the Humanitext project, which enables advanced semantic search of Western classical literature through generative AI and retrieval-augmented generation (RAG). At the same time, substantial questions remain regarding the evaluation of AI-extracted information and knowledge, as well as their effective use in actual research practice.
In this background, this paper examines methods for extracting and utilizing structured data from historical sources using generative AI, taking Latin inscriptions as a case study. Many Latin epigraphic texts are already made available as machine-readable data in a comprehensive database. Using these texts, this study designs prompts grounded in domain expertise to extract information such as persons, groups, and places; records of individuals’ careers and political, social, and economic activities; and relationships among entities, producing structured data in JSON format. The extracted data are then mapped, in accordance with an ontology designed to represent the semantic content of inscriptions, into an RDF-compliant knowledge graph.
The presentation will discuss this data construction workflow in detail and, drawing on practical experience, raise issues concerning challenges identified in the process as well as the evaluation and quality control of AI-extracted data, and concrete approaches to its use in historical research.
| Abstract in Japanese (if needed): | 近年の生成AIの急速な発展によって、歴史資料を対象とする知識構造化や情報発見のありようは大きく変化しつつある。すなわち、従来蓄積されてきた資料のメタデータにとどまらず、資料の中に記述されている出来事や関係性、状況といった具体的な意味内容の抽出が可能になりつつある。もちろん、こうした資料の中身を構造化する試みは生成AIの登場以前から行われてきたが、多くの場合、自然言語で記述される歴史資料からの多様かつ複雑な情報を自動的に抽出することは困難であるため、どうしても人手による作業が要求され、その規模は限定的なものにとどまっていた。 高い文脈理解能力を持つ生成AIは、こうした状況を克服し、人間による読解のみでは扱いきれない膨大な資料群から、その記述内容を含む高精細な知識を抽出し、利用可能にする可能性を秘めている。そうした可能性を実際に探求する研究はなお僅かではあるが、国内においても、生成AIを用いてサガのテキストから知識グラフを構築する試みや、生成AIとRAGを用いて西洋古典文献の高度な意味検索を可能にするHumanitextプロジェクトなどがすでに一定の成果をあげている。一方で、生成AIによって抽出された情報や生成された知識の評価や、実際の研究活動における利用のあり方については議論の余地が多分にある。 そうした状況を踏まえ、このpaperではラテン語碑文という歴史資料を事例に、生成AIを用いて、歴史資料の記述内容を構造化データとして抽出・活用する手法についての検討を行う。ラテン語碑文テキストについて、その多くがデータベースに格納され、機械可読なテキストデータとして提供されている。本研究ではこれらのテキストデータを用い、 人物・集団・地名、人物が有する経歴や政治・社会・経済的な活動の記録、人物間および人物-集団間の関係性といった情報を抽出するためのプロンプトを専門的知見に基づいて設計することで、JSON形式の構造化データを抽出した。さらに、抽出された構造化データを、碑文の意味内容記述のために設計したオントロジーに則って、RDF準拠の知識グラフとして利用可能とした。 発表では、以上のデータ構築のワークフローを詳細に論じるとともに、データ構築の過程で見えてきた課題、および生成AIによって抽出されたデータの評価やクオリティコントロールのあり方、また、歴史研究への具体的な利用のあり方について、実践を踏まえた問題提起を行う。 |
Paper short abstract
This presentation outlines recent developments in Digital Humanities and Digital History in Japan. It introduces large-scale research projects, methodological challenges such as AI-based analysis of historical materials, and prospects for data-driven historical research in an international context.
Paper long abstract
This presentation opens the panel by providing an overview of the current state of Digital Humanities (DH) in Japan, with particular focus on recent developments in Digital History within Japanese historical studies. In step with international trends, Digital Humanities has become an increasingly important topic in the humanities in Japan. Notably, the Japanese Ministry of Education, Culture, Sports, Science and Technology has positioned AI for Science as a key national policy, which has also heightened the significance of DH within the humanities and social sciences.
Within this broader context, large-scale DH projects related to historical research have recently been launched in Japan. The first is a research infrastructure–oriented project aimed at promoting data-driven historical research through the systematic accumulation, management, and sharing of document images and related datasets, alongside the development of AI-based methods for information extraction and classification. This project began in fiscal year 2024. The second project, launched in fiscal year 2025, integrates historical research practices that incorporate AI with public history, exploring new forms of engagement between academic research and society.
Several challenges must be addressed under these conditions. Improving the accuracy of AI-based automatic reading of historical materials from different periods, followed by advances in linguistic analysis and semantic interpretation, remains a central task. The digitization and advanced utilization of analog-based historical sources will enable broader access to Japanese historical materials and research by a wide range of actors, including scholars based outside Japan, non-professional historians, and information scientists working across disciplines.
Furthermore, advancing data-driven historical research requires not only shared infrastructures, but also standardized metadata design, open and extensible data interfaces, and protocols for sharing research outcomes. By outlining the key issues of these projects together with subsequent case studies, this presentation provides a framework for discussing new possibilities and ongoing challenges for historical research in Japan within an international scholarly context.
| Abstract in Japanese (if needed): | 本報告は、本パネルの冒頭発表として、日本における Digital Humanities(DH)の現状を概観し、その中でも特に日本の歴史研究における Digital History の近年の展開に焦点を当てるものである。国際的な動向と歩調を合わせる形で、Digital Humanities は日本においても人文学分野の中でますます重要なテーマとなっている。とりわけ、日本の文部科学省は AI for Science を国家的に重要な施策として位置づけており、これにより人文学・社会科学分野においても Digital Humanities の意義が一層高まっている。 こうした背景のもと、日本では歴史研究に関連する大規模な DH プロジェクトが近年相次いで立ち上げられている。一つ目は、データ駆動型の歴史研究を推進することを目的とした研究基盤型プロジェクトであり、文書画像や関連データの体系的な蓄積・管理・共有を進めるとともに、AI を用いた情報抽出や分類手法の開発に取り組んでいる。このプロジェクトは 2024 年度に開始された。もう一つは、2025 年度に始動したプロジェクトで、AI を取り入れた歴史研究の実践とパブリックヒストリーを結びつけ、学術研究と社会との新たな関係性を模索している。 このような状況の中で、いくつかの重要な課題が浮かび上がっている。第一に、時代や形態の異なる過去の歴史資料を対象とした AI による自動読み取りの精度向上と、それに続く言語解析や意味理解の高度化が求められている。アナログベースの歴史資料をデジタル化し、高度に利活用することによって、日本国外の研究者や、職業的歴史研究者ではない人々、さらには分野横断的に活動する情報学研究者など、より広範なアクターが日本の歴史資料や研究にアクセスできるようになる。 さらに、データ駆動型の歴史研究を推進するためには、共通基盤の整備にとどまらず、標準化されたメタデータ設計、オープンで拡張可能なデータインターフェース、研究成果を共有するためのプロトコルの整備が不可欠である。本報告では、これらのプロジェクトの論点を整理し、後続の事例報告とともに、日本における歴史研究の新たな可能性と継続的な課題について、国際的な学術的文脈の中で議論するための枠組みを提示する。 |