Проследяване на факти в LM: MIT и Google Dataset и Benchmark Track придобитите знания Назад към данните за обучение

Впечатляващото представяне на настоящите модели на невронен език (LM) се дължи на способността им да запомнят и използват голямо количество фактически знания от огромните им данни за обучение. Въпреки че през последните години се появиха различни услуги за проверка на факти на трети страни за идентифициране на дезинформация и дезинформация в публикации в социалните медии, отразяване на новини и други, остава трудно да се проследят знанията, придобити от LM, до конкретни данни за обучение за анализ и проверка. На фона на нарастващата обществена загриженост относно липсата на прозрачност в системите за изкуствен интелект, „откриването на фактите“ от LM води до конкретните данни, които ги информираха, остава решаваща, но относително недостатъчно проучена задача.

В новия вестник Проследете знанията в езикови модели обратно до данните за обучениеИзследователски екип от MIT CSAIL и Google Research представя нов еталон за проследяване на твърденията на езиковия модел обратно към свързаните данни за обучение, с цел установяване на принципна истина на основата и смекчаване на високите изчислителни изисквания за широкомащабно обучение на LM.

Екипът първо идентифицира основните пречки, които възпрепятстват ефективното установяване на факти в MLs: 1) Не е ясно как да се получат основните данни за истината, т.е. какво точно означава обучителен пример да бъде „отговорен“ за фактическо изложение ? ; и 2) Традиционните методи, базирани на влияние, за свързване на прогнози с обучителни данни бързо стават непосилни за изчисление поради милиардите параметри в днешните LM.

За да се справи с тези проблеми, екипът проучва осъществимостта на установяване на факти в MLs чрез изграждане на набор от данни за оценка с недвусмислена достоверна информация относно произхода на конкретни факти; и прилагането на поносима процедура, която позволява прилагането на методи за установяване на факти към широкомащабни ML.

Изследователите изградиха своя набор от данни за оценка, като възприеха специализиран учебен корпус – набора от данни TREx (Elsahar et al., 2018) – който идентифицира всички изречения, които изразяват или не изразяват конкретен факт. По този начин обучението с набора от данни TREx позволява на изследователите да получат основни „промоутери“ на истината, отговорни за дадено LM прогнозиране.

За да смекчи изключително високите разходи за изчисляване на влияние, екипът приложи проста настройка за пренареждане, често използвана при извличане на информация, при която приписването не се изпълнява на всеки пример за обучение, а по-скоро само на малка подгрупа от кандидат-примери, които включват привърженици на истинската истина и примери за “разсейващи”, които не са истински промоутъри. Фактът, че моделът идентифицира истински поддръжници сред трудни разсейващи фактори, позволява на екипа да разграничи изпълнението на няколко метода за установяване на факти.

В своето емпирично проучване екипът използва предложения еталон, за да оцени методите на влияние, базирани на градиент (Koh and Liang, 2017; Pruthi et al., 2020) и вграждане (Rajani et al., 2020). ) на задачи за извличане на информация. Те също така включват основна техника за извличане на информация (IR) (BM25, Robertson et al., 1995; Lv и Zhai, 2011), която няма достъп до LM и просто избира обучителни примери, които показват силно припокриване на лексикално с прогнозиране на модела.

Донякъде изненадващо, резултатите показват, че простият подход без корекция на IR BM25 превъзхожда двата подхода за влияние. Дори и с обширна настройка на хиперпараметри и настройки за оценка, предназначени да ги благоприятстват, настоящите методи, базирани на влияние, не могат надеждно да идентифицират примери за обучение, за които е известно, че са отговорни за специфични прогнози на модели.

Екипът също така изследва ефектите от избора на слоеве, контролните точки на модела и подходите за фина настройка, анализ, който подчертава насищането на градиента като ключов фактор, влияещ върху ефективността на откриването на факти на настоящите методи. Екипът стига до заключението, че остава да се свърши значителна работа, преди теоретичните ползи от техниките за влияние за установяване на факти да могат да се превърнат в емпиричен успех.

Екипът се надява, че техният нов показател ще насърчи бъдещи изследвания за откриване на факти чрез установяване на принципна истина и смекчаване на високите изчислителни разходи.

Хартията Проследете знанията в езикови модели обратно до данните за обучение е на arXiv.


Автор: Хеката Той | Редактор: Мишел Саразен


Знаем, че не искате да пропуснете новини или изследователски пробиви. Абонирайте се за нашия популярен бюлетин Седмичен синхронизиран глобален AI за да получавате ежеседмични актуализации на AI.

Add Comment