Cyc

Cyc (uitgespreek /ˈsaɪk/ SYKE) is 'n langtermyn kunsmatige intelligensie-projek wat daarop gemik is om 'n omvattende ontologie en kennisbasis saam te stel wat die basiese konsepte en reëls oor hoe die wêreld werk, omvat. In die hoop om gesonde verstand kennis vas te vang, fokus Cyc op implisiete kennis (onbewuste kennis). Die projek het in Julie 1984 by Microelectronics and Computer Technology Corporation (MCC) begin en is later deur die Cycorp-maatskappy ontwikkel.
Die naam "Cyc" (van "ensiklopedie" in Engels, “encyclopedia”) is 'n geregistreerde handelsmerk wat deur Cycorp besit word. CycL het 'n publiek-vrygestelde spesifikasie, en dosyne HL (Heuristiese Vlak)-modules is beskryf in Lenat en Guha se handboek,[1] maar die Cyc-inferensie-enjinkode en die volledige lys HL-modules is Cycorp-eiendom.[2]
Geskiedenis
[wysig | wysig bron]Die projek het in Julie 1984 deur Douglas Lenat begin as 'n projek van die Microelectronics and Computer Technology Corporation (MCC), 'n navorsingskonsortium wat deur twee korporasies in die Verenigde State begin is "om 'n destydse onheilspellende Japannese poging in KI, die sogenaamde 'vyfdegenerasie'-projek, teë te werk."[3] Die VSA het die Nasionale Koöperatiewe Navorsingswet van 1984 goedgekeur, wat vir die eerste keer VSA maatskappye toegelaat het om te "saamspan" oor langtermynnavorsing. Sedert Januarie 1995 is die projek onder aktiewe ontwikkeling deur Cycorp, waar Douglas Lenat die HUB was.
Die CycL verteenwoordigingstaal het begin as 'n uitbreiding van RLL[4][5] (die Representation Language Language, ontwikkel in 1979–1980 deur Lenat en sy nagraadse student Russell Greiner terwyl hulle aan Stanford-universiteit was). In 1989[6] het CycL uitgebrei in uitdrukkingskrag na hoër-orde logika (HOL).
Cyc se ontologie het in 1994 tot ongeveer 100 000 terme gegroei, en vanaf 2017 het dit ongeveer 1 500 000 terme bevat. Die Cyc-kennisbasis wat ontologiese terme behels, is grootliks geskep deur hand-aksioma-skryf; dit was op ongeveer 1 miljoen in 1994, en vanaf 2017 is dit op ongeveer 24,5 miljoen.
In 2008 is Cyc-bronne na baie Wikipedia-artikels gekarteer.[7] Cyc is tans aan Wikidata gekoppel.
Kennisbasis
[wysig | wysig bron]Die kennisbasis word in mikroteorieë verdeel. Anders as die kennisbasis as geheel, moet elke mikroteorie vry wees van monotoniese teenstrydighede. Elke mikroteorie is 'n eersteklas objek in die Cyc-ontologie; dit het 'n naam wat 'n gereelde konstante is. Die konsepname in Cyc is CycL terme of konstantes.[6] Konstante begin met 'n opsionele #$ en is hooflettergevoelig. Daar is konstantes vir:
- Individuele items bekend as individue, soos
#$BillClinton
of#$France
. - Versamelings, soos
#$Tree-ThePlant
(wat alle bome bevat) of#$EquivalenceRelation
(wat alle ekwivalensieverhoudings bevat). 'n Lid van 'n versameling word 'n instansie van daardie versameling genoem.[1] - Funksies wat nuwe terme uit gegewe terme produseer. Byvoorbeeld,
#$FruitFn
, wanneer voorsien word van 'n argument wat 'n tipe (of versameling) plante beskryf, sal die versameling van sy vrugte terugstuur. Volgens konvensie begin funksiekonstantes met 'n hoofletter en eindig met die stringFn
. - Waarheidsfunksies, wat op een of meer ander konsepte van toepassing kan wees en waar of onwaar kan teruggee. Byvoorbeeld,
#$siblings
is die broer en suster, waar as die twee argumente broers en susters is. Volgens konvensie begin waarheidsfunksiekonstantes met 'n kleinletter.
Vir elke instansie van die versameling #$ChordataPhylum
(d.w.s. vir elke chordaat), bestaan daar 'n vroulike dier (instansie van #$FemaleAnimal
), wat sy moeder is (beskryf deur die predikaat #$biologicalMother
).[1]
Inferensie-enjin
[wysig | wysig bron]‘n Inferensie-enjin is 'n rekenaarprogram wat antwoorde uit 'n kennisbasis probeer aflei. Die Cyc inferensie-enjin voer algemene logiese afleiding uit.[8] Dit voer ook induktiewe redenering, statistiese masjienleer en simboliese masjienleer, en abduktiewe redenering uit.
Die Cyc-inferensie-enjin skei die epistemologiese probleem van die heuristiese probleem. Vir laasgenoemde het Cyc 'n gemeenskap-van-agente-argitektuur gebruik waarin gespesialiseerde modules, elk met sy eie algoritme, geprioritiseer is as hulle vordering met die subprobleem kon maak.
Vrystellings
[wysig | wysig bron]OpenCyc
[wysig | wysig bron]Die eerste weergawe van OpenCyc is in die lente van 2002 vrygestel en het slegs 6 000 konsepte en 60 000 feite bevat. Die kennisbasis is vrygestel onder die Apache-lisensie. Cycorp het sy voorneme verklaar om OpenCyc onder parallelle, onbeperkte lisensies vry te stel om aan die behoeftes van sy gebruikers te voldoen. Die CycL- en SubL-tolk (die program wat gebruikers toelaat om deur die databasis te blaai en te redigeer asook om afleidings te maak) is gratis vrygestel, maar slegs as 'n binêre, sonder bronkode. Dit is beskikbaar gestel vir Linux en Microsoft Windows. Die oopbron Texai[9]-projek het die RDF-versoenbare inhoud vrygestel wat uit OpenCyc onttrek is.[10] Die gebruikerskoppelvlak was in Java 6. Cycorp was 'n deelnemer van 'n werkgroep vir die Semantiese Web, Standard Upper Ontology Working Group, wat van 2001 tot 2003 aktief was.[11]
'n Semantiese webweergawe van OpenCyc was beskikbaar vanaf 2008, maar eindig iewers na 2016.[12]
OpenCyc 4.0 is in Junie 2012 vrygestel.[13] OpenCyc 4.0 het 239 000 konsepte en 2 093 000 feite bevat; dit is egter hoofsaaklik taksonomiese bewerings. 4.0 was die laaste vrygestelde weergawe, en rondom Maart van 2017 is OpenCyc gesluit vir die beweerde rede dat "omdat sulke "fragmentering" gelei het tot divergensie, en gelei het tot verwarring onder sy gebruikers en die tegniese gemeenskap in die algemeen dat daardie OpenCyc-fragment Cyc was.[14]
ResearchCyc
[wysig | wysig bron]In Julie 2006 het Cycorp die uitvoerbare van ResearchCyc 1.0 vrygestel, 'n weergawe van Cyc wat op die navorsingsgemeenskap gemik is, gratis. (ResearchCyc was in beta-stadium van ontwikkeling gedurende die hele 2004; 'n beta-weergawe is in Februarie 2005 vrygestel.) Benewens die taksonomiese inligting, sluit ResearchCyc meer semantiese kennis in; dit sluit ook 'n groot leksikon, Engelse ontleed- en genereringshulpmiddels en Java-gebaseerde koppelvlakke vir kennisredigering en navrae in. Dit bevat 'n stelsel vir ontologie-gebaseerde data-integrasie.
Toepassings
[wysig | wysig bron]In 2001 het GlaxoSmithKline die Cyc befonds, maar vir onbekende toepassings.[15] In 2007 het die Cleveland Clinic Cyc gebruik om 'n natuurlike-taalnavraag-koppelvlak van biomediese inligting oor kardiotorakse operasies te ontwikkel.[16] 'n Navraag word in 'n stel CycL-fragmente met oop veranderlikes ontleed.[17] Die Terrorism Knowledge Base was 'n toepassing van Cyc wat probeer het om kennis oor "terroriste"-verwante beskrywings te bevat. Die kennis word as stellings in wiskundige logika gestoor. Die projek het van 2004 tot 2008 geduur.[18][19] Lycos het Cyc gebruik vir soekterm ondubbelsinning, maar het in 2001 opgehou.[20] CycSecure is in 2002 vervaardig,[21] 'n netwerkkwesbaarheid-assesseringsinstrument gebaseer op Cyc, met proewe by die US STRATCOM Computer Emergency Response Team.[22]
One Cyc-toepassing het die verklaarde doel om studente te help om wiskunde op 'n graad 6-vlak te doen.[23] Die toepassing, genaamd MathCraft,[24] was veronderstel om die rol te speel van 'n medestudent wat effens meer verward is as die gebruiker oor die vak. Aangesien die gebruiker goeie raad gee, laat Cyc die avatar toe om minder foute te maak.
Kritiek
[wysig | wysig bron]Die Cyc-projek is beskryf as "een van die mees omstrede pogings van die kunsmatige intelligensie-geskiedenis".[25] Catherine Havasi, uitvoerende hoof van Luminoso, sê dat Cyc die voorloperprojek vir IBM se Watson is.[26] Masjienleer wetenskaplike Pedro Domingos verwys na die projek as 'n "katastrofiese mislukking" vir die oneindige hoeveelheid data wat nodig is om enige lewensvatbare resultate te produseer en die onvermoë vir Cyc om op sy eie te ontwikkel.[27]
Gary Marcus, 'n kognitiewe wetenskaplike en die medestigter van 'n KI-maatskappy genaamd Geometric Intelligence, sê "dit verteenwoordig 'n benadering wat baie verskil van al die diepleer dinge wat in die nuus was."[28] Dit stem ooreen met Doug Lenat se standpunt dat "Soms is die fineer van intelligensie nie genoeg nie".[29]
Bekende werknemers
[wysig | wysig bron]Hierdie is 'n lys van 'n paar van die noemenswaardige mense wat werk of gewerk het op Cyc óf terwyl dit 'n projek by MCC was (waar Cyc die eerste keer begin is) of Cycorp.
- Douglas Lenat
- Michael Witbrock
- Pat Hayes
- Ramanathan V. Guha
- Stuart J. Russell
- Srinija Srinivasan
- Jared Friedman
- John McCarthy
Verwysings
[wysig | wysig bron]- ↑ 1,0 1,1 1,2 Lenat, Douglas B.; Guha, R. V. (1989). Building Large Knowledge-Based Systems; Representation and Inference in the Cyc Project (1st uitg.). Boston, MA, USA: Addison-Wesley Longman Publishing Co., Inc. ISBN 978-0201517521.
- ↑ Lenat, Douglas. "Hal's Legacy: 2001's Computer as Dream and Reality. From 2001 to 2001: Common Sense and the Mind of HAL" (PDF). Cycorp, Inc. Geargiveer (PDF) vanaf die oorspronklike op 9 Desember 2019. Besoek op 26 September 2006.
- ↑ Wood, Lamont (2002). "The World in a Box". Scientific American. 286 (1): 18–19. Bibcode:2002SciAm.286a..18W. doi:10.1038/scientificamerican0102-18.
- ↑ "A Representation Language Language". www.aaai.org. Besoek op 27 November 2017.
- ↑ Russell, Greiner (Oktober 1980) (in en). RLL-1: A Representation Language Language (Report). https://apps.dtic.mil/sti/citations/ADA096510.
- ↑ 6,0 6,1 Lenat, Douglas B.; Guha, R. V. (Junie 1991). "The Evolution of CycL, the Cyc Representation Language". ACM SIGART Bulletin. 2 (3): 84–87. doi:10.1145/122296.122308. ISSN 0163-5719. S2CID 10306053.
- ↑ "Integrating Cyc and Wikipedia: Folksonomy meets rigorously defined common-sense" (PDF). Besoek op 10 Mei 2013.
- ↑ "cyc Inference engine". Geargiveer vanaf die oorspronklike op 9 Desember 2019. Besoek op 4 Junie 2015.
- ↑ "The open source Texai project". Geargiveer vanaf die oorspronklike op 16 Februarie 2009.
- ↑ "Texai SourceForge project files".
- ↑ "Standard Upper Ontology Working Group (SUO WG) - Home Page". 15 Januarie 2013. Geargiveer vanaf die oorspronklike op 15 Januarie 2013. Besoek op 16 Desember 2024.
- ↑ "OpenCyc for the Semantic Web". Geargiveer vanaf die oorspronklike op 21 Augustus 2008. Besoek op 16 Desember 2024.
- ↑ "OpenCyc.org". 23 Junie 2012. Geargiveer vanaf die oorspronklike op 23 Junie 2012. Besoek op 16 Desember 2024.
- ↑ "OpenCyc". Geargiveer vanaf die oorspronklike op 22 April 2017. Besoek op 16 Desember 2024.
- ↑ HILTZIK, MICHAEL A. (21 Junie 2001). "Birth of a Thinking Machine". Los Angeles Times (in Engels (VSA)). ISSN 0458-3035. Geargiveer vanaf die oorspronklike op 13 Desember 2019. Besoek op 29 November 2017.
- ↑ "Case Study: A Semantic Web Content Repository for Clinical Research". www.w3.org (in Engels (VSA)). Besoek op 28 Februarie 2018.
- ↑ Lenat, Douglas; Witbrock, Michael; Baxter, David; Blackstone, Eugene; Deaton, Chris; Schneider, Dave; Scott, Jerry; Shepard, Blake (28 Julie 2010). "Harnessing Cyc to Answer Clinical Researchers' Ad Hoc Queries". AI Magazine (in Engels). 31 (3): 13. doi:10.1609/aimag.v31i3.2299. ISSN 0738-4602.
- ↑ Chris Deaton; Blake Shepard; Charles Klein; Corrinne Mayans; Brett Summers; Antoine Brusseau; Michael Witbrock; Doug Lenat (2005). "The Comprehensive Terrorism Knowledge Base in Cyc". Proceedings of the 2005 International Conference on Intelligence Analysis. CiteSeerX 10.1.1.70.9247.
- ↑ AFRL-RI-RS-TR-2008-125, April 2008 .Terrorism Knowledge Base (TKB) Final Technical Report. https://www.researchgate.net/publication/235042082_Terrorism_Knowledge_Base_TKB, Douglas B. Lenat Chris Deaton, Air Force Research Laboratory Information Directorate, Rome Research Site, Rome, New York
- ↑ "Computer to Save World?". 5 September 2015. Geargiveer vanaf die oorspronklike op 5 September 2015. Besoek op 15 Desember 2024.
- ↑ "Cyc in use". Computerworld (in Engels (VSA)). 8April 2002. Besoek op 2024-12-15.
{{cite web}}
: Gaan datum na in:|date=
(hulp) - ↑ Shepard, Blake; Matuszek, Cynthia; Fraser, C. Bruce; Wechtenhiser, William; Crabbe, David; Güngördü, Zelal; Jantos, John; Hughes, Todd; Lefkowitz, Larry; Witbrock, Michael; Lenat, Doug; Larson, Erik (9 Julie 2005). "A knowledge-based approach to network security: applying Cyc in the domain of network risk assessment". Proceedings of the 17th Conference on Innovative Applications of Artificial Intelligence - Volume 3. IAAI'05. Pittsburgh, Pennsylvania: AAAI Press: 1563–1568. ISBN 978-1-57735-236-5.
- ↑ Lenat, Douglas B.; Durlach, Paula J. (1 September 2014). "Reinforcing Math Knowledge by Immersing Students in a Simulated Learning-By-Teaching Experience". International Journal of Artificial Intelligence in Education (in Engels). 24 (3): 216–250. doi:10.1007/s40593-014-0016-x. ISSN 1560-4292.
- ↑ "Mathcraft by Cycorp". www.mathcraft.ai. Besoek op 29 November 2017.
- ↑ Bertino, Piero & Zarria 2001, p. 275
- ↑ Havasi, Catherine (9 Augustus 2014). "Who's Doing Common-Sense Reasoning And Why It Matters". TechCrunch (in Engels). Besoek op 29 November 2017.
- ↑ Domingos, Pedro (2015). The Master Algorithm: How the Quest for the Ultimate Learning Machine Will Remake Our World. Basic Books. ISBN 978-0465065707.
- ↑ Knight, Will (14 Maart 2016). "An AI that spent 30 years learning some common sense is ready for work". MIT Technology Review (in Engels). Besoek op 29 November 2017.
- ↑ Doug Lenat (15 Mei 2017). "Sometimes the Veneer of Intelligence is Not Enough". CogWorld (in Engels). Besoek op 29 November 2017.