فن آوری پاسخگویی به پرسش به صورت آنلاین QA

 پاسخگویی به پرسش چیست؟
هر روز سوالهای زیادی پرسیده و پاسخ داده می شوند. فن آوری پاسخگویی به پرسش (QA) می خواهد همین امکان را به صورت آنلاین فراهم آورد. این فناوری در تلاش برای تشخیص اینکه یک پرسش چه می گوید و برای اینکه با یک جواب دقیق به آن پاسخ دهد، از شیوه جستجو بر اساس کلیدواژه ها (همانطور که در Google، Yahoo و موتورهای جستجوی دیگر وجود دارد) فراتر می رود. این امر از دو طریق اوضاع را برای کاربران تسهیل می کند. اول اینکه، پرسشها غالبا تبدیل به فهرستی از کلیدواژه ها نمی شوند. برای مثال، سوال
پاپ در دهه 1960 از کدام کشورها دیدار کرد؟
به سادگی به کلیدواژه های "کشورها"، "پاپ"، "دیدار"، "دهه 1960" تبدیل نمی شود چرا که اگر جستجویی روی آن کلیدواژه ها انجام شود تنها اسنادی (صفحات وب) یافت خواهند شد که شامل کلمات "کشورها" (یا "کشور"، در صورتی که موتور جستجو صورت جمع کلمات را تشخیص دهد)، "پاپ"، "دیدار"، "دهه 1960" باشند و نه کلمات یا عباراتی که دلالت بر کشورهایی خاص (نظیر "پادشاهی متحده"، یا "ایالات متحده")، یا پاپ ("رئیس کلیسای کاتولیک"، برای مثال)، یا یک تاریخ در محدوده زمانی 10 ساله بین سالهای "1960" و "1970" می کنند. برای نزدیکتر شدن به نتیجه مورد نظر باید مجموعه پیچیده تری از کلیدواژه ها را در اختیار داشت، و تجربه نشان داده که مردم نحوه فرمول بندی و استفاده از چنین مجموعه هایی را یاد نخواهند گرفت.(سیارک
دوم اینکه،  فن آوری پاسخگویی به پرسش QA به جای اینکه لیستی قابل جستجو از پیوندها به اسنادی (صفحات وب) ارائه کند که شاید با سوال مرتبط باشند، مسئولیت ارائه پاسخها را بر عهده می گیرد. پیوندهای مذکور با بریده هایی از متن اصلی هایلایت می شوند که نشان می دهد یک عبارت جستجو چطور با آن سند منطبق شده است. هر چند وقتی که پاسخ در بریده هایی از متن ظاهر شود و دسترسی بیشتر به سند غیرضروری باشد ارائه پاسخ زحمت زیادی هم ندارد، اما فناوری QA قصد دارد این امر را از یک ویژگی تصادفی جستجو به کانون آن منتقل کند.
در جستجوی کلیدواژه ای و در بیشتر کاری که امروزه روی فناوری QA انجام می شود، فرآیند جستجوی اطلاعات بعنوان یک امر یک باره ای دیده شده است: کاربر سوالی می پرسد و سیستم یک پاسخ رضایتبخش ارائه می کند. با این حال، در کارهای آغازین روی QA  این فرض لحاظ نشد، و بواسطه آن در کاربردهایی که جدیدا هدف گذاری شده اند دشواری هایی ایجاد می شود: با وجود اینکه یک کاربر ممکن است سعی کند سوالی را فرمول بندی کند تا پاسخش اطلاعاتی باشد که او می خواهد، اما تا وقتی که هنوز چیزی برای بررسی برگشت داده نشده او نخواهد فهمید که موفق شده است یا خیر. اگر چیزی که برمی گردد رضایت بخش نباشد یا اصلا جواب نباشد، باز هم مورد توجه است، چون یک کاربر باید بتواند سوالات بیشتری که از مطالب قبلی ها فهمیده شده اند بپرسد. برای این کاربردهای هدف، QA باید بخشی از فرآیند جستجوی اشتراکی باشد .

 سیستمهای اولیه پاسخگویی به پرسش

سیستمهای اولیه QA ایجاد شده بودند تا کاربران را قادر سازند سوالهای جالبی در مورد مجموعه داده های خوش ساخت نظیر آمار بیسبال، اطلاعات کارمندان، یا تحلیل شیمیایی نمونه های خاک و سنگ از کره ماه، بپرسند. این سیستمهای QA اولیه اساسا یک انتهای جلویی و یک انتهای پشتی به یک سیستم پایگاه داده مربوط می کردند. انتهای جلویی کار تجزیه و تفسیر و بازنمایی را انجام می داد. سوالاتی که به صورت عبارات روزمره بیان می شدند را به شکلی بازنمایی می کرد که محاسبه ای را مشخص کنند تا روی پایگاه داده اجرا شود – برای مثال، سوال
 غلظت متوسط آلمینیوم در سنگهای با خاصیت قلیایی بالا چیست؟
به محاسبه ای بازنمایی می شود که سنگهای با خاصیت قلیایی بالا را در پایگاه داده مشخص می کند، غلظت آلمینیوم را در هر کدام پیدا کرده، و سپس یک میانگین را در بین آن مقادیر محاسبه می کند.(سیارک
به خاطر پیچیدگی بالقوه چنین عبارتهای جستجویی، تفاوتهای بین مدلهای زمینه ای سیستم و کاربر از داده ها، به علاوه کمبود همیشگی آگاهی کاربران از اینکه واقعا اطلاعات در پایگاه داده چیست، توسعه اولیه QA روی مسائلی از قبیل موارد زیر متمرکز شد:
• بازنمایی سوالات کاربر به شکل عبارات جستجوی قابل محاسبه در پایگاه داده؛
• رسیدگی کردن به سوالاتی که نمی توانستند تجزیه شوند یا نمی توانستند به عنوان یک عبارت جستجوی معتبر تفسیر شوند؛
• حل و فصل ابهامات نحوی و ارجاعی شناسایی شده در پرسش؛
• رسیدگی کردن به تفاوتها در اینکه چگونه کاربر و سیستم دامنه را تصور می کردند 
• شناسایی، درمورد پایگاه های داده توزیع شده، چه اطلاعاتی از کجا بایستی وارد می شد، تا به سوال کاربر پاسخ داده شود .

تعاملات کاربر سیستم که برای حل و فصل ابهامات و یا رفع عدم تطابق بین باورهای کاربر و سیستم در مورد دامنه طراحی شد نشان داد که برآورده کردن نیازهای اطلاعاتی کاربر، مستلزم این بود که او کاری بیش از فقط پرسش سوال و سیستم هم کاری بیش از فقط پاسخ به آنها انجام دهد.

نخستین فعالیتها روی پایگاه دادهQA در اصل در اواخر دهه 1980 به دو دلیل  یکی فنی، و یکی اجتماعی رها شد. از منظر فنی، تلاش قابل توجهی لازم بود تا بازنگاری موثر و قابل اعتمادی را بین سوالات کاربران و عبارات جستجوی پایگاه داده تضمین کند. نه تنها بازنگاری صحیح به ساختار آن پایگاه داده خاص بستگی داشت، بلکه بسیاری از سوالات کاربران با تعابیر مختلف، می بایست بر روی یک عبارت جستجوی یکسان در پایگاه داده بازنگاری می شد. حتی بدتر، پرسشهایی که تفاوتهای حداقلی داشتند باید بر روی عبارات جستجوی بسیار متفاوت پایگاه داده بازنگاری می شدند. تنها راه حل موجود در آن زمان برای این مشکلات، قواعد بازنگاری بیشتر و بیشتری بود که می بایست به دست متخصصین سیستم نوشته می شد. به عنوان یک راه حل، این امر نه مقیاس پذیر و نه قابل حمل بود. مشکل اجتماعی، عدم مخاطبان قابل توجه برای این فن آوری بود: مردم عادی فاقد دسترسی به مجموعه داده های بزرگ بودند، و مدیرانی که شرکتهای آنها مجموعه داده های بزرگی داشت خودشان فاقد علاقه کافی نسبت به دستیابی به داده ها بودند. شرکت هایی مانند سیمانتیک که نرم افزار بسیار پیشرفته ای برای پایگاه داده QA ایجاد کردند ودر نهایت آن را رها کردند. (سیارک
با ظهور وب، این مشکل اجتماعی ناپدید شد، و تکنیک های یادگیری ماشینی که مفید بودن خود را در حوزه های دیگر فن آوری زبان ثابت کرده اند در حال ورود به مسئله یادگیری بازنگاریهای (پیچیده) بین سوالات کاربران و عبارات جستجوی پایگاه داده هستند. با وجود اینکه هنوز روزهای اولیه است، اما این بدان معنی است که تعداد فزاینده ای از پایگاه های داده حاوی اطلاعات غنی و مفید ممکن است دوباره از طریق پرسشهای زبان طبیعی آماده دسترسی شوند..........این مقاله ادامه دارد. ترجمه  itrans.ir

نظرات

برای ارسال نظر باید وارد حساب کاربری شوید. ورود یا ثبت نام

بیشتر بخوانید