طرح متون تمدن اسلامی (طمتا)

ایجاد اولین پیکره قابل تحلیل با ماشین برای متون پیشامدرن تمدن اسلامی

در مورد طمتا

میراث نوشتاری در تمدن اسلامی که در گستره‌ای از بنگال تا اسپانیا امروزی یافت می‌شود، همان قدری که وسیع است به همان اندازه کم درباره آن تحقیق شده‌است. حجم عظیم متون باقیمانده به زبان‌های عربی و فارسی که مردمان این سرزمین‌ها در دوران پیشامدرن نوشته‌اند، این پیکره را به موضوعی ایده‌آل برای تحلیل رایانه‌ای تبدیل کرده است. هر چند که با نبود پیکره نوشتاری قابل‌اعتماد استفاده از این روش‌های دیجیتال جدید بی‌ثمر مانده‌است.

طمتا تلاشی از سوی چند نهاد برای ایجاد اولین پیکره قابل تحلیل با ماشین برای استفاده تحقیقاتی از متون پیشامدرن تمدن اسلامی است. طمتا تحت نظر محققانی از دانشگاه آقاخان، دانشگاه لایپزیگ و مؤسسه روشن در دانشگاه مری‌لند (در کالج پارک) همراه با هیئت مشاورانی از حوزه‌های مختلف دانش از میان محققان علوم انسانی دیجیتال، مطالعات اسلامی و عربی، مطالعات ایرانی، در نظر دارد که زیرساخت متنی موردنیاز در زبان‌های فارسی و عربی را برای بکارگیری انواع مختلف تحلیل‌های گسترده متنی و تحقیقات دیجیتال ایجاد کند. در این میان، طمتا امکان ایجاد پیوندهای جدیدی میان علوم انسانی دیجیتال و حوزه‌های مرتبط میان‌رشته‌ای تمدن اسلامی در رشته‌های مطالعات اسلامی، مطالعات ایرانی و فارسی، و مطالعات عربی را فراهم می‌کند.

نقشه عملیاتی طمتا

بعد از کامل کردن پروژه‌های نمونه برای ایجاد پیکره‌های فارسی و عربی در سال 2015، (پروژه کتاب و کتابخانه دیجیتال فارسی)، اعضای طمتا اقدام به طراحی برنامه عملیاتی برای در‌هم‌آمیختن این فعالیت‌ها و ایجاد یک پیکره واحد متون تمدن اسلامی (شامل تقریباً ده‌هزار متن؛ حدود 7000 متن عربی و 3000 متن فارسی) خواهند کرد. در این قسمت سه مرحله وجود دارد: 1. بررسی و آماده‌سازی متون موجود و رایگان دیجیتال عربی و فارسی مطابق با CapiTainS canonical text services (CTS) standards؛ 2. غنی‌سازی این متون با توجه فراداده‌های تأییدشده تا حد امکان (با استفاده از سازمان داده‌های ما در پروژه‌های نمونه ما)؛ 3. پس از بررسی نتایج مرحله اول نقشه راه، توسعه و عملیاتی کردن برنامه‌ای برای هماهنگ‌سازی بیشتر متون دو پیکره عربی و فارسی از لحاظ تعداد، ژانر و دوره زمانی در پیکره واحد طمتا. اطلاعات تکمیلی در مورد مرحله اجرایی طمتا در اینجا در دسترس است.

اعضای طمتا

مجریان اصلی

سارا بونت سَوِنت ماکسیم رومانف ماتیو توماس میلر
دانشیار مؤسسه مطالعه تمدن‌های مسلمان دانشگاه آقاخان، لندن
kitab-project.org
محقق اکساندر فون همبولت، کرسی علوم انسانی دیجیتال، مؤسسه علوم کامپیوتر دانشگاه لایپزیگ محقق مؤسسه روشن در مؤسسه مطالعات ایرانی روشن مدیر طرح روشن برای علوم انسانی دیجیتال فارسی دانشگاه مریلند، (کالج پارک)

ارتباط با ما

برای اطلاعات بیشتر در مورد طمتا، لطفاً با مدیر پروژه سمر علی عطا sata@umd.edu تماس بگیرید، و یا مرا در Github دنبال کنید.
Github