Nhận dạng cá nhân trong hình ảnh của mục tin dựa vào phân tích văn bản
Bạn đang xem tài liệu "Nhận dạng cá nhân trong hình ảnh của mục tin dựa vào phân tích văn bản", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
Tài liệu đính kèm:
- nhan_dang_ca_nhan_tong_hinh_anh_cua_muc_tin_dua_vao_phan_tic.pdf
Nội dung text: Nhận dạng cá nhân trong hình ảnh của mục tin dựa vào phân tích văn bản
- Nhòn ra thïë giúái NHÊÅN DAÅNG CAÁ NHÊN TRONG HÒNH AÃNH CUÃA MUÅC TIN DÛÅA VAÂO PHÊN TÑCH VÙN BAÃN Choochart Haruechaliyasak vaâ Chaianun Damrongrat Trung têm Quöëc gia Cöng nghïå Àiïån tûã vaâ Maáy tñnh Thaái Lan 1. Múã àêìu Àïí giaãi quyïët quy mö lúán cuãa Web, Àï í tùng thïm hònh anhã va â cung cêpë nhiïìu maáy tòm hònh aãnh àaä chêëp nhêån caách cho ngûúiâ àocå taiâ liïuå minh hoa,å phênì lúná tiïëp cêån tòm theo chó muåc àang àûúåc website tin tûcá thûúngâ àûa vaoâ baiâ mucå cacá aáp duång thaânh cöng cho viïåc tòm trang nöiå dung àa phûúng tiïnå gùnæ vúiá hònh anhã web [8]. Phepá tòm theo chó mucå àiïní hònh va â video clip. Mötå trong nhûngä mucå tiïu vaâ laiå dûaå vaoâ mö thûcá tuiá tû â àï í xacá àõnh cêuë thachá thûcá trong viïcå tòm hònh anhã la â phaiã trucá chó mucå àao,ã nghôa la,â möiî thuêtå ngû ä seä nhênå dangå àungá va â tòm àûúcå hònh anhã cuaã chó túiá mötå danh sachá tû liïuå co á chûaá thuêtå ngû ä ào.á Theo mö thûcá tuiá tû,â mötå tû liïuå coá ca á nhên cu å thï í tû â bö å sûu têpå hònh anhã lún.á chûaá cêu hoiã àêuì vaoâ ú ã bêtë ky â chö î naoâ trong Nhûäng cöng trònh nghiïn cûáu trûúác àêy nöiå dung àïuì àûúcå coi la â trungá àñch va â seä vïì nhêån daång con ngûúâi trong caác hònh aãnh àûúcå phanã höiì cho ngûúiâ sû ã dung.å thûúâng dûåa vaâo hai caách tiïëp cêån khaác Àöëi vúái pheáp tòm hònh aãnh, möåt chó muåc nhau: nhêån mùåt vaâ tòm chó muåc. Nhêån mùåt coá thïí àûúåc xêy dûång tûâ nhiïìu mêíu thöng dûåa vaâo möåt söë kyä thuêåt xûã lyá hònh aãnh àïí tin vùn baãn nhû tïn file aãnh, caác lúâi thuyïët xêy dûång vaâ nhêån biïët caác àùåc àiïím tûâ hònh minh gùæn liïìn vúái hònh aãnh vaâ caác àoaån vùn aãnh böå mùåt [16]. Vúái möåt loaåt caãi tiïën àûúåc baãn liïìn kïì vúái hònh aãnh [6]. thûåc hiïån trong nhiïìu nùm qua, nhêån mùåt Noái chung, sûã duång pheáp tòm theo chó àaä àûúåc aáp duång thaânh cöng trong nhiïìu muåc cho caác hònh aãnh trïn Web laâ hûäu ûáng duång nhû trùæc lûúång sinh hoåc vaâ àiïån hiïåu. Tuy nhiïn, tòm hònh aãnh cuãa caác caá tûã hoåc tiïu duâng (vñ duå, maáy aãnh söë). Tuy nhên cuå thïí trong lônh vûåc tin tûác àöi khi nhiïn, aáp duång nhêån daång mùåt trong lônh coá thïí àûa ra kïët quaã khöng mong muöën. vûåc tòm hònh aãnh ngûúâi coá möåt söë haån chïë Vúái mö thûác tuái tûâ àún giaãn, möåt cêu hoãi vò nhûäng lyá do sau àêy: (1) taách ra vaâ biïët tòm möåt ngûúâi coá thïí tûúng ûáng vúái möåt àûúåc caác àùåc àiïím vïì hònh tûâ caác hònh aãnh vaâi muåc tin (nghôa laâ ngûúâi àoá àûúåc noái túái àoâi hoãi rêët nhiïìu thúâi gian xûã lyá; (2) àïí trong nhiïìu tin) maâ hònh aãnh cuãa caác muåc nhêån ra tûâng caá nhên cuå thïí àoâi hoãi phaãi coá àoá coá caã aãnh cuãa nhûäng ngûúâi khaác. Do àoá, möåt kñch cúä mêîu hònh mùåt thñch húåp, do nhûäng hònh aãnh khöng tûúng thñch àöi khi àoá, caách tiïëp cêån naây khöng àûúåc múã röång cuäng àûúåc àûa ra cho ngûúâi sûã duång cuâng nhiïìu khi xûã lyá möåt söë lûúång lúán caá nhên vúái hònh aãnh àuáng cuãa caá nhên muåc tiïu. vaâ (3) kyä thuêåt nhêån mùåt àún giaãn khöng Chuáng töi xin minh hoåa vêën àïì naây bùçng àuã maånh àïí nhêån daång con ngûúâi tûâ nhûäng caách sûã duång möåt vñ duå tûâ Pheáp tòm hònh goác nhòn khaác nhau vaâ trong nhûäng hònh aãnh tin tûác theo Google11 dûåa trïn phûúng aãnh àöå phên giaãi thêëp. phaáp tiïëp cêån tòm theo chó muåc. Hònh 1 cho 1 Google News, 28 THÖNG TIN vaâ TÛ LIÏÅU - 2/2012
- Nhòn ra thïë giúái thêëy kïët quaã tòm bùçng caách sûã duång nhêìm hònh aãnh naây cuãa “Hillary Clinton”. “Barack Obama” laâm cêu hoãi. Tûâ caác kïët Muåc àñch chñnh cuãa baâi naây laâ caãi tiïën quaã naây, hún möåt nûãa söë hònh aãnh phaãn höìi hiïåu suêët cuãa pheáp tòm theo chó muåc cú baãn khöng coá hònh aãnh cuãa“Barack Obama”. àïí tòm àûúåc caác caá nhên trong caác hònh aãnh Theo quan saát ban àêìu cuãa chuáng töi, tin tûác. Caách tiïëp cêån cuãa chuáng töi laâ aáp möåt muåc tin thûúâng chûáa hònh aãnh cuãa caá duång phên tñch cuá phaáp vïì nöåi dung vùn nhên muåc tiïu nïëu tïn cuãa ngûúâi àoá xuêët baãn (vñ duå, caác àêìu àïì vaâ chuá thñch hònh hiïån nhû chuã ngûä chñnh trong caác cêu khaác aãnh) àïí nhêån daång khùèng àõnh vaâ phuã àõnh nhau cuãa muåc tin, vñ duå trong àêìu àïì vaâ caá nhên trong caác hònh aãnh tin tûác. Pheáp chuá thñch hònh aãnh. Hònh 2 laâ vñ duå vïì möåt phên tñch cuá phaáp trong phûúng phaáp cuãa muåc tin lêëy tûâ website tin tûác cuãa CNN2 coá chûáa hònh aãnh cuãa möåt caá nhên vúái àêìu àïì chuáng töi bao göìm viïåc àõnh nhaän thûåc thïí vaâ chuá thñch hònh aãnh. Tûâ hònh naây, hai coá tïn vaâ phên tñch cuá phaáp sú böå [1, 3]. Tûâ thûåc thïí tïn ngûúâi “Hillary Clinton” vaâ Hònh 2, bùçng caách thûåc hiïån phên tñch àêìu “Barack Obama” xuêët hiïån trong caã àêìu àïì tin, “Clinton” seä àûúåc phên tñch vaâ àõnh àïì lêîn chuá thñch hònh aãnh. Khi sûã duång nhaän nhû laâ möåt cuåm danh tûâ (NP), sau àoá pheáp tòm theo chó muåc àún giaãn, möåt cêu “chêëp nhêån” nhû möåt cuåm àöång tûâ (VP) vaâ hoãi tòm “Barack Obama” coá thïí seä àûa “Obama” nhû laâ möåt cuåm danh tûâ (NP) Hònh 1. Kïët quaã tòm “Barack Obama” theo pheáp tòm hònh aãnh tin tûác trïn Google 2 CNN.com International , THÖNG TIN vaâ TÛ LIÏÅU - 2/2012 29
- Nhòn ra thïë giúái Àêìu àï:ì Clinton hêåu thuêîn cho Obama, kïu goåi sûå thöëng nhêët trong Àaãng Chuá thñch : Thûúång nghõ syä Hillary Clinton caãm ún nhûäng ngûúâi uãng höå baâ vïì baâi diïîn vùn hêåu thuêîn cho Thûúång nghõ syä Barack Obama Hònh 2. Vñ duå vïì hònh aãnh möåt caá nhên vúái àêìu àïì vaâ chuá thñch hònh aãnh Tûâ cêu naây, coá thïí ruát ra hai quy tûâ Hònh 2, tuy nhiïn, hònh aãnh naây seä àûúåc tùæc: (1) [NP*] [VP] [NP] àïí nhêån daång loåc ra bùçng caách sûã duång quy tùæc nhêån khùèng àõnh ngûúâi trong caác hònh aãnh : daång phuã àõnh [NP] [VP] [NP*] vò vaâ (2) [NP] [VP] [NP*] àïí nhêån daång phuã “Obama” xuêët hiïån nhû laâ NP* trong cêu. àõnh, trong àoá dêëu * chó võ trñ xuêët hiïån tïn Kïët quaã thñ nghiïåm vïì têåp húåp hònh aãnh tin ngûúâi. Quy tùæc nhêån daång khùèng àõnh coá tûác cho thêëy, caách tiïëp cêån phên tñch cuá nghôa laâ: nïëu tïn ngûúâi àoá xuêët hiïån nhû phaáp coá thïí caãi thiïån möåt caách àaáng kïí möåt cuåm danh tûâ vaâ laâ chuã ngûä cuãa möåt cêu hiïåu suêët tòm kiïëm àöëi vúiá pheáp tòm theo thò hònh aãnh naây chùæc chùæn coá chûáa ngûúâi chó muåc cú baãn. muöën tòm. Ngûúåc laåi, quy tùæc nhêån daång 2. Caác cöng trònh nghiïn cûáu liïn phuã àõnh coá nghôa laâ: nïëu tïn ngûúâi naây quan xuêët hiïån nhû möåt cuåm danh tûâ vaâ laâ tên Caác cöng trònh nghiïn cûáu trûúác àêy vïì ngûä cuãa möåt cêu thò hònh aãnh naây khöng tòm kiïëm hònh aãnh chuã yïëu dûåa vaâo hai kyä chùæc chùæn chûáa ngûúâi muöën tòm. thuêåt khaác nhau : tòm hònh aãnh dûåa vaâo vùn Sûã duång têåp húåp muåc tin coá àõnh nhaän, baãn vaâ dûåa vaâo nöåi dung (CBIR) [4]. Caách chuáng ta xêy dûång àûúåc möåt böå quy tùæc cuá tiïëp cêån dûåa vaâo vùn baãn cùn cûá vaâo thöng phaáp dûåa vaâo nhûäng yá tûúãng noái trïn. Sau tin vùn baãn kïët húåp vúái hònh aãnh àïí khúáp àoá, böå quy tùæc cuá phaáp àûúåc sûã duång àïí lûåa möåt cêu hoãi àêìu vaâo, göìm möåt hay nhiïìu choån vaâ saâng loåc caác kïët quaã hònh aãnh do tûâ, vaâo caác hònh aãnh. Do khaã nùng tuây biïën pheáp tòm theo chó muåc àem laåi. Tûâ vñ duå kñch cúä, caách tòm hònh aãnh dûåa vaâo vùn baãn trïn, cêu hoãi “Obama” seä tòm ra hònh aãnh àaä àûúåc aáp duång phöí biïën úã nhiïìu maáy tòm 30 THÖNG TIN vaâ TÛ LIÏÅU - 2/2012
- Nhòn ra thïë giúái nhû Google 3 vaâ Yahoo 4 . Mùåt khaác, CBIR caách tiïëp cêån dûåa vaâo vùn baãn àïí tòm ngûúâi aáp duång kyä thuêåt xûã lyá hònh aãnh àïí taách ra trong caác muåc tin tûác. Sihari [13] àaä àûa ra vaâ biïët àûúåc caác àùåc àiïím hònh tûâ caác hònh hïå thöëng goåi laâ Piction, duâng caác chuá thñch aãnh . Trong caác hïå thöëng CBIR, möåt cêu aãnh àïí nhêån daång tûâng caá nhên tûâ möåt hònh hoãi vïì hònh, mö taã caác àùåc àiïím hònh nhû aãnh coá chûáa nhiïìu ngûúâi. Hïå thöëng naây kïët maâu sùæc vaâ kïët cêëu, àûúåc duâng àïí tòm ra húåp thuêåt toaán àõnh võ mùåt trong hònh aãnh hònh aãnh tûúng ûáng töët nhêët vúái caác àùåc vúái möàun NLP àïí phên tñch võ trñ khöng àiïím àêìu vaâo [7, 12]. gian cuãa caá nhên tûâ chuá thñch hònh aãnh. Vúái söë lûúång lúán hònh aãnh trïn Web coá Yagnik vaâ Islam [14] àaä àûa ra phûúng chûáa aãnh cuãa caác caá nhên, àïì taâi nghiïn phaáp dûåa vaâo nhêån biïët sûå àöìng xuêët hiïån cûáu vïì tòm kiïëm hònh aãnh phuåc vuå cho viïåc cuãa vùn baãn vaâ hònh aãnh trïn Web. Caách tòm hònh aãnh ngûúâi àaä ngaây caâng àûúåc chuá tiïëp cêån naây goåi laâ nhêån biïët nhêët quaán, yá. Trong caách tòm hònh aãnh ngûúâi, nïëu àùåt thûúâng duâng àïí chuá giaãi hònh aãnh ngûúâi. cêu hoãi tòm möåt tïn ngûúâi cuå thïí, muåc àñch Yang vaâ Hauptmann [15] àûa ra phûúng laâ phaãi tòm àûúåc chñnh xaác caác hònh aãnh phaáp nhêån biïët thöëng kï àïí nhêån daång möîi cuãa ngûúâi àoá (ûu tiïn laâ aãnh caá nhên) tûâ böå caá nhên xuêët hiïån trong bùng video truyïìn sûu têåp hònh aãnh lúán (vñ duå, tûâ caác website hònh dûåa vaâo vùn caãnh tòm thêëy trong caác tin tûác). Kyä thuêåt tòm hònh aãnh ngûúâi tûúng baãn sao cheáp video. Edwards vaâ nhûäng tûå nhû caác kyä thuêåt àûúåc sûã duång àïí tòm ngûúâi khaác [5] aáp duång phûúng phaáp phên kiïëm hònh aãnh noái chung. Caách tiïëp cêån nhoám vùn baãn àïí têåp húåp hònh aãnh ngûúâi dûåa vaâo nöåi dung, vaâo kyä thuêåt nhêån mùåt vaâo möåt söë nhoám chuã àïì. Möåt söë quan saát àïí xêy dûång vaâ biïët caác àùåc àiïím hònh tûâ vïì cêëu truác cuá phaáp tïn ngûúâi trong caác chuá hònh aãnh böå mùåt. Rêët nhiïìu cöng trònh thñch hònh aãnh àaä àûúåc baân àïën vaâ sûã duång nghiïn cûáu trûúác àêy vïì tòm kiïëm hònh trong caác thñ nghiïåm. aãnh ngûúâi àïìu dûåa vaâo kyä thuêåt nhêån Phêìn àoáng goáp chñnh cuãa chuáng töi laâ mùåt [2,9,10,11]. Chuáng àaä aáp duång caác àûa ra caách tiïëp cêån coá hiïåu lûåc vaâ coá khaã biïën thïí cuãa kyä thuêåt nhêån mùåt àïí liïn kïët nùng nêng cúä tuây biïën tûå àöång xêy dûång böå caác hònh aãnh mùåt vúái tïn ngûúâi àûúåc tòm quy tùæc cuá phaáp àïí nhêån daång caá nhên thêëy trong caác muåc tin. Nhû àaä noái úã trïn, trong caác hònh aãnh tin tûác. Caác quy tùæc naây aáp duång kyä thuêåt nhêån mùåt khöng coá nhiïìu àûúåc sûã duång àïí choån lûåa vaâ saâng loåc caác khaã nùng nêng cúä tuây biïën vò coá nhiïìu kïët qua ã hònh aãnh maâ phûúng phaáp tòm theo ngûúâi trong caác tin tûác. Do àoá, cêìn coá möåt chó muåc àûa laåi. kñch cúä mêîu lúán cuãa hònh aãnh mùåt cho möîi 3. Caách tiïëp cêån dûåa vaâo phên tñch caá nhên. Ngoaâi ra, viïåc taách ra vaâ nhêån biïët vùn baãn caác àùåc àiïím hònh tûâ hònh aãnh mùåt àoâi hoãi Caách tiïëp cêån cuãa chuáng töi trong tòm nhiïìu thúâi gian xûã lyá. kiïëm hònh aãnh ngûúâi seä kïët húåp viïåc tòm Àïí tùng khaã nùng nêng cúä tuây biïën, theo chó muåc vúái viïåc phên tñch cuá phaáp nhiïìu cöng trònh nghiïn cûáu àaä aáp duång caác thûåc thïí coá tïn ngûúâi (NE) trong nöåi 3 Google Image Search, 4 Yahoo! Search- Image Search THÖNG TIN vaâ TÛ LIÏÅU - 2/2012 31
- Nhòn ra thïë giúái dung vùn baãn. Nïëu cho möåt cêu hoãi tòm tïn nhaän nhû laâ caác mêîu khùèng àõnh hoùåc phuã ngûúâi, caách tòm kiïëm theo chó muåc thûúâng àõnh. Mêîu khùèng àõnh laâ caác cêu coá chûáa cung cêëp nhûäng hònh aãnh khöng àuáng tïn ngûúâi àûúåc hiïín thõ trong hònh aãnh. ngoaâi nhûäng hònh aãnh àuáng cuãa caá nhên Mêîu phuã àõnh laâ caác cêu coá chûáa tïn ngûúâi muåc tiïu. YÁ tûúãng chñnh laâ xêy dûång böå khaác maâ khöng xuêët hiïån trong hònh aãnh. quy tùæc cuá phaáp tûâ thöng tin vùn baãn àïí loåc Hònh 4 laâ vñ duå vïì caác mêîu khùèng àõnh vaâ ra caác hònh aãnh khöng àuáng. phuã àõnh. Àöëi vúái mêîu khùèng àõnh, cêu hoãi Hònh 3 minh hoåa quy trònh töíng thïí xêy tòm “Tiger Woods” seä aánh xaå àuáng vúái dûång böå quy tùæc cuá phaáp tûâ möåt têåp húåp hònh aãnh àaä cho. Àöëi vúái mêîu phuã àõnh, muåc tin. Nïëu muåc tin chûáa möåt hònh aãnh cêu hoãi tòm “Rafael Nadal” coá thïí seä aánh ngûúâi, chuáng töi aáp duång viïåc nhêån biïët xaå sai túái hònh aãnh cuãa möåt cêìu thuã quêìn thûåc thïí coá tïn àïí àõnh nhaän têët caã caác thûåc vúåt khaác “Lleyton Hewitt”. Coá thïí thêëy thïí coá tïn cuãa con ngûúâi xaä höåi trong thöng rùçng, àöëi vúái mêîu khùèng àõnh, tïn ngûúâi tin vùn baãn (nghôa laâ: àêìu àïì, phuå àïì vaâ chuá muåc tiïu xuêët hiïån nhû laâ chuã ngûä cuãa cêu. thñch aãnh). Têët cacá caác cêu coá chûáa caác Mùåt khaác, àöëi vúái mêîu phuã àõnh, tïn ngûúâi thûåc thïí coá tïn ngûúâi àûúåc têåp húåp vaâ àõnh muåc tiïu xuêët hiïån nhû laâ tên ngûä cuãa cêu. Hònh 3. Caách tiïëp cêån àïí xêy dûång böå quy tùæc saâng loåc 32 THÖNG TIN vaâ TÛ LIÏÅU - 2/2012
- Nhòn ra thïë giúái Mêîu khùèng àõnh cho cêu hoãi tòm Mêîu khùèng àõnh cho cêu hoãi tòm “Tiger Woods” “Rafael Nadal” Àêìu àï:ì Tiger Woods cêìn bùæt àêìu ra quên súám hún Tiïíu àï:ì Nhaâ 4 lêìn vö àõch Lieyton Hewitt seä cuâng Andy Muray vaâ Rafael Nadal tham gia giaãi vö àõch AEGON thaáng sau úã Cêu laåc böå Queen Hònh 4. Vñ duå vïì caác mêîu khùèng àõnh vaâ phuã àõnh Mötå khi thu thêpå àûúcå cacá mêuî khùngè dõch]; trong àoá NP chó cuåm danh tûâ, VP chó àõnh va â phu ã àõnh tû â têpå húpå tin tûc,á thò kyä cuåm àöång tûâ vaâ PP chó cuåm giúái tûâ. Vò cêu thuêtå phên tñch cu á phapá sú bö å àûúcå apá dungå trïn coá chûáa hònh aãnh cuãa “Barack àï í phên àoanå va â àõnh nhanä cacá thûcå thï í co á tïn Obama”, chuáng ta coá thïí coá quy tùæc nhêån ngûúiâ va â têtë ca ã cacá thuêtå ngû ä khacá trong cêu. daång khùèng àõnh nhû [#] [NP*] [VP] [NP]: khùèng àõnh, trong àoá # chó giúái haån cêu, * Chùèng haån, cêu “Obama cêìn 1,5 tyã àöla chó võ trñ xuêët hiïån tïn ngûúâi vaâ: khùèng cho caác chïë phêím chöëng dõch” seä àûúåc àõnh laâ nhaän loaåi. Trong baâi naây, chuáng töi phên tñch cuá phaáp vaâ àõnh nhaän nhû sau duâng NLP múã, 5 , möåt cöng cuå phên tñch [NP Obama] {VP cêìn] [NP1,5 tyã àöla], vùn baãn, àïí thûåc hiïån têët caã caác nhiïåm vuå [PP daânh cho] [NP caác chïë phêím chöëng xûã lyá vùn baãn liïn quan. Hònh 5. Quy trònh saâng loåc kïët quaã tòm kiïëm hònh aãnh 5 The OpenNLP Homepape, THÖNG TIN vaâ TÛ LIÏÅU - 2/2012 33
- Nhòn ra thïë giúái Sau khi coá böå quy tùæc nhêån daång khùèng coá nhûäng nhaän loaåi khùèng àõnh vaâ phuã àõnh vaâ phuã àõnh, chuáng töi xêy dûång böå àõnh. Do àoá, chuáng töi tñnh tyã söë àiïím cuãa quy tùæc saâng loåc àïí loåc ra caác kïët quaã hònh aãnh sai àûúåc höìi àaáp tûâ pheáp tòm theo chó tûâng quy tùæc saâng loåc bùçng tyã söë giûäa söë muåc. Cuâng möåt söë quy tùæc cuá phaáp coá thïí nhaän phuã àõnh vaâ söë nhaän khùèng àõnh. söë lûúång (quy tùæc phuã àõnh) söë àiïím (quy tùæc saâng loåc) = söë lûúång (quy tùæc khùèng àõnh) Trûúâng húåp söë nhaän khùèng àõnh bùçng 0, Baãng 1. Danh saách tïn ngûúâi trong têåp nghôa laâ quy tùæc chó xuêët hiïån úã loaåi phuã húåp thûã nghiïåm àõnh. Nhûäng quy tùæc naây thûúâng àûúåc coi Tïn ngûúâi Loaåi laâ àûáng àêìu trong söë caác quy tùæc khaác. Tyã Barack Obama Chñnh trõ söë àiïím bùçng 1, nghôa laâ quy tùæc xuêët hiïån ngang nhau trong caã loaåi khùèng àõnh vaâ Hillary Clinton Chñnh trõ phuã àõnh. Chuáng töi xem xeát caác quy tùæc coá Tiger Woods Thïí thao giaá trõ tyã söë àiïím lúán hún 1 (nghôa laâ, söë David Beckham Thïí thao lûúång (quy tùæc phuã àõnh) > söë lûúång (quy Rafael Nadal Thïí thao tùæc khùèng àõnh). Hònh 5 minh hoåa quaá trònh Britney Spears Giaãi trñ saâng loåc caác kïët quaã tòm kiïëm hònh aãnh tûâ caách tiïëp cêån tòm theo chó muåc. Nïëu àùåt Angelina Jolie Giaãi trñ cêu hoãi tòm theo tïn ngûúâi, hïå thöëng seä tòm thêëy têët caã caác hònh aãnh coá chûáa tïn cuãa caá Baãng 2. Caác quy tùæc saâng loåc haâng àêìu nhên muåc tiïu tûâ baãng chó muåc. Kïë tiïëp, Tyã söë Caác quy tùæc saâng loåc caác baãn mö taã thaânh vùn caác hònh aãnh àûúåc àiïím xûã lyá vúái pheáp phên tñch cuá phaáp sú böå, sau [NP] [VP] [NP*][PP][NP] 7,0 àoá, caác quy tùæc saâng loåc àûúåc aáp duång àïí [#] [NP*] [O] [#] 5,0 loaåi ra caác hònh aãnh chùæc chùæn khöng chûáa [NP] [VP] [NP*] [#] 2,67 caá nhên muåc tiïu. [#] [NP*] [VP] [ADVP] 2,0 Caác thûã nghiïåm vaâ trao àöíi [#] [NP*] [NP] [O] 2,0 Àïí àaánh giaá hiïåu quaã cuãa phûúng phaáp [O] [VP] [NP*] [O] [#] 2,0 maâ chuáng töi àûa ra, chuáng töi thûåc hiïån [O] [VP] [NP*][NP] [O] 2,0 möåt söë thñ nghiïåm coá sûã duång böå sûu têåp [NP] [VP] [NP*] [VP] [NP] 2,0 hònh aãnh tin tûác nhêån àûúåc tûâ caách tòm hònh [NP] [O] [NP*] [VP] [ADJP] 2,0 aãnh tin tûác trïn Google. Khi coá danh saách [NP] [PP] [NP*][O] [NP] 1,67 caác caá nhên thuöåc caác loaåi khaác nhau (nhû trònh baây trong Baãng 1), chuáng töi taãi Sûã duång têåp húåp naây, chuáng töi àaä xêy xuöngë caác nöåi dung vùn baãn cuâng vúái hònh dûång böå quy tùæc saâng loåc dûåa vaâo quy trònh aãnh vaâ chuá thñch keâm theo. Söë lûúång hònh àaä noái úã trïn. Chuáng töi àùåt söë lûúång töëi àa aãnh hiïån taåi trong têåp húåp xêëp xó 500. gram cho pheáp (nghôa laâ söë lûúång maä 34 THÖNG TIN vaâ TÛ LIÏÅU - 2/2012
- Nhòn ra thïë giúái thöng baáo trong möåt quy tùæc) bùçng 5 xuyïn Àöëi vúái caách tòm theo chó muåc, chuáng töi suöët caác thûã nghiïåm . Baãng 2 cho thêëy möåt xêy dûång möåt baãng chó muåc caác thuêåt ngûä söë quy tùæc haâng àêìu dûåa vaâo tñnh àiïím àûúåc taách ra vaâ maä hoáa thöng baáo tûâ thöng àûúåc cho trong phûúng trònh (1), trong àoá, tin vùn baãn cuãa möîi muåc tin. Àöëi vúái caách [#] chó giúái haån cêu, * chó võ trñ xuêët hiïån tiïëp cêån phên tñch cuá phaáp, chuáng töi aáp tïn ngûúâi, NP chó cuåm danh tûâ, VP chó cuåm duång böå quy tùæc cuá phaáp àïí loåc ra caác kïët àöång tûâ, PP chó cuåm giúái tûâ , ADVP chó quaã hònh aãnh maâ caách tòm theo chó muåc cuåm traång tûâ, ADJP chó cuåm tñnh tûâ, vaâ O àem laåi. Möåt hònh aãnh maâ trong àoá vùn baãn chó möåt kyá tûå àùåc biïåt. Coá thïí tòm thêëy kïët húåp ûáng vúái caác quy tùæc saâng loåc seä danh saách àêìy àuã kyá hiïåu àõnh nhaän tûâ Dûå àûúåc loaåi khoãi caác kïët quaã. Chuáng töi sûã aán Penn Treebank6. duång pheáp trùæc lûúång tòm chuêín vïì àöå Chuáng töi àaánh giaá hiïåu suêët cuãa caách chñnh xaác, mûác àöå höìi àaáp (mûác àöå tòm laåi tiïëp cêån phên tñch cuá phaáp àaä àûa ra bùçng àûúåc) vaâ söë ào F1 àïí àaánh giaá. Caác kïët quaã caách so saánh vúái caách tòm theo chó muåc. thûã nghiïåm àûúåc töíng kïët trong Baãng 3. Baãng 3. Kïët quaã àaánh giaá caách tòm hònh aãnh ngûúâi tûâ caác muåc tin tûác Caách tiïëp cêån Àöå chñnh xaác Mûác àöå höìi àaáp Söë ào F1 Tòm theo chó muåc 47,17 100,00 64,10 Phên tñch cuá phaáp 59,08 99,61 74,17 Tûâ caác kïët quaã àoá, caách tiïëp cêån tòm phaáp coá ñch cho viïåc saâng loåc kïët quaã sai tûâ theo chó muåc àaä cho mûác àöå höìi àaáp bùçng caác hònh aãnh maâ caách tòm theo chó muåc 100%. Àiïìu naây coá àûúåc laâ do cêu hoãi tòm àem laåi. ngûúâi ûáng vúái têët caã caác hònh aãnh coá chûáa Kïët luêån vaâ dûå àõnh tûúng lai tïn ngûúâi àoá trong thöng tin vùn baãn. Tuy Chuáng töi àaä àûa ra phûúng phaáp phên nhiïn, hún möåt nûãa kïët quaã àûa laåi àaä tñch cuá phaáp àïí tòm ngûúâi trong caác hònh khöng chûáa hònh aãnh àuáng cuãa caá nhên aãnh cuãa muåc tin. Muåc àñch chñnh cuãa muåc tiïu. Kïët quaã laâ giaá trõ vïì àöå chñnh xaác chuáng töi laâ nêng cao chêët lûúång kïët quaã chó xêëp xó 47%. Viïåc aáp duång quy trònh tòm kiïëm hònh aãnh thu àûúåc khi duâng caách saâng loåc giuáp nêng cao àöå chñnh xaác lïn tòm theo chó muåc dûåa vaâo vùn baãn. Quaá xêëp xó 59%, trong khi mûác àöå höìi àaáp hêìu trònh àõnh nhaän thûåc thïí coá tïn vaâ phên tñch nhû vêîn giûä nguyïn. Do àoá, caách phên tñch cuá phaáp sú böå àûúåc aáp duång vaâo nöåi dung cuá phaáp giuáp loaåi boã möåt söë trûúâng húåp vùn baãn, vñ duå, àêìu àïì tin vaâ chuá thñch hònh khùèng àõnh sai cuãa caách tòm theo chó muåc. aãnh àïí gaán nhaän loaåi tûâ (POS) thñch húåp Toám laåi, caách tiïëp cêån tòm theo chó muåc àaä cho caác thûåc thïí tïn ngûúâi vaâ moåi thuêåt cho hiïåu suêët theo söë ào F1 bùçng 64,10%. ngûä khaác. Möåt böå quy tùæc cuá phaáp àïí nhêån Khi duâng caách phên tñch cuá phaáp, F1 àaä daång ngûúâi xuêët hiïån trong caác hònh aãnh tùng lïn 74,17%. Do àoá, caác quy tùæc cuá àûúåc xêy dûång tûâ têåp húåp coá àõnh nhaän. 6 Penn Treebank Project, treebank THÖNG TIN vaâ TÛ LIÏÅU - 2/2012 35
- Nhòn ra thïë giúái Chuáng töi sûã duång caác quy tùæc cuá phaáp naây ngêuî nhiïn co á àiïuì kiïnå (CRFs) àï í xêy àïí saâng loåc caác kïët quaã hònh aãnh maâ caách dûngå mötå cachá hûuä hiïuå cacá quy tùcæ cu á phapá tòm theo chó muåc àem laåi. Dûåa vaâo caác kïët tû â cacá têpå húpå co á àõnh nhan.ä Mötå têpå húpå quaã àaánh giaá, phûúng phaáp cuãa chuáng töi hònh anhã tin tûcá lúná hún cungä se ä àûúcå thu thêpå va â sû ã dungå àï í àanhá gia á toanâ diïnå hún. àaä nêng hiïåu suêët lïn 10% theo söë ào F1 so vúái pheáp tòm theo chó muåc àún giaãn. Vuä Vùn Sún (Dõch) Nguöìn: the Role of Digital Libraries in a Chungá töi dû å àõnh apá dungå mötå sö ë kyä Time of Global Change”: ICADL 2010, thuêtå nhênå biïtë bùngç mayá nhû cacá trûúngâ LNCS 6102, pp. 216-225 Tham chiïëu thû muåc 1. Abney, S.: Parsing by chunks. In: Berwick, R., Faces and Names in Japanese Photo News Articles Abney, S., Tenny, C. (eds.) Principle-Based Parsing. on the Web. In: Proc. of the 22nd Int. conf. on Kluwer Academic Publishers, Dordrecht (1991) Advanced Information Networking and Applications – 2. Berg, T.L., Berg, A.C., Edwards, J., Maire, M., Workshops, pp. 1156-1161 (2008) White, R., Yee-Whye, T., Learned-Miller, E., Forsyth, 10. Liu, C., Jiang, S., Huang, Q.: Naming faces in D.A.: Names and faces in the News. In: Proc. of the broadcast news video by image google. In: Proc. of 2004 IEEE Conf. on Computer Vision and Pattern the 16th ACM int. conf. on multimedia, pp. 717-720 Recognition, pp.848-854 (2004) (2008) 3. Chinchor, N.: MUC-7 Named Entity Task Defin- 11. Ozkan, D., Duygulu, P.: A Graph Based ition (Version 3.5) MUC-7, Fairfax, Virginia (1998) Approach for Naming Faces on News Photos. In 4. Datta, R., Joshi, D., Li, J., Wang, J.Z.: Image Proc. of the 2006 IEEE Conf. on Computer Vision and Retrieval: Ideas, influences, and trends of the new Pattern Recognition, pp. 1477-1482 (2006) age. ACM Computing Surveys (CSUR) 40(2), 1-60 12. Smeulders, A.W.M., Worring, M/. Santini, S., (2008) Gupta, A., Jain, R.: Content-Based Image Retrieval at 5. Edwards, J., White, R., Forsyth, D.: Words and the End of the Early Years. IEEE Transactions on Pictures in the News. In: Proc. of the HLT-NAACL Patterns Analysis and Machine Intelligence 22(12), 2003 workshop on learning word meaning from non- 1349-1380 (2000) linguistic data, pp. 6-13 (2003) 13. Shrihari, R.K.: Automatic Indexing and Con- 6. He, X., Cai, D., Wen, J.-R., Ma, W.-Y., Zhang, tent-Based Retrieval of Captioned Images. Computer H.-J.: Clustering and searching WWW images using 28(9), 49-56 (1995) link and page layout analysis. ACM Trans. on Multi- media Computing, Communications, and Applications 14. Yagnik, J., Islam, A.: Learning people annota- 3(2) (2007) tion from the web via consistency learning. In: Proc. of 7. Horster, E., Lienhart, R., Slaney, M.: Image the int. workshop on multimedia information retrieval, Retrieval on large-scale image databases. In : Proc. pp. 285-290 (2007) of the 6th ACM int. conf. on image and video retrieval, 15. Yang, J., Hauptmann, A.G.: Naming every pp. 17-24 (2007) individual in news video monologues. In : Proc. of the th 8. Kherfi, M.L. Ziou, D., Bernardi, A.: Image 12 ACM int. conf. on multimedia, pp. 580-587 Retrieval from the World Wide Web Issues, Tech- (2004) niques, and Systems . ACM Computing Surveys 16. Zhao, W., Chellappa, R., Phillips P.J., Rosen- (CSUR) 36(1), 35-67 (2004) feld, A.: Face recognition: A literature survey: ACM 9. Kitahara, A, Joutou, T., Yanai, K.: Associating Computing Surveys (CSUR) 35(4), 399-458 (2003) 36 THÖNG TIN vaâ TÛ LIÏÅU - 2/2012