Wikipedia:De kroeg/Archief/20230705

Dubbele Wikidata?

Ik stuitte toevallig op twee Wikidata-items die gelijk lijken te zijn: https://www.wikidata.org/wiki/Q68021460 en https://www.wikidata.org/wiki/Q8312741 In de eerste staat wel wat informatie genoemd, maar in de tweede staat meer informatie en is ook een artikel op CS:WP gekoppeld (op de eerste is niks gekoppeld). Het lijkt echt om dezelfde personen te gaan. Kan iemand dat verifiëren? En indien dat zo is, hoe verder te gaan (samenvoeg- of verwijderverzoek)? Mondo (overleg) 21 jun 2023 14:01 (CEST)[reageren]

Even de publicaties vergeleken en de items samengevoegd. Samenvoegen hoef je niet te verzoeken. Gewoon de merge gadget activeren op Wikidata en je kan items zelf samenvoegen.

Verwijderen bij duplicaten is in principe not done. Dit mede ivm externe hergebruikers. Bij samenvoegen komen ze door de redirect op het juiste item uit. Mbch331 (overleg) 21 jun 2023 14:13 (CEST)[reageren]

Bedankt voor het samenvoegen! Ik zie echter geen “merge”- of samenvoeggadget in de zijbalken. Waar zou die dan moeten staan? Mondo (overleg) 21 jun 2023 14:15 (CEST)[reageren]

Die moet je eerst bij uitbreidingen in je voorkeuren activeren. Mbch331 (overleg) 21 jun 2023 14:18 (CEST)[reageren]

Aha! Nooit bij stilgestaan dat je naast Wikipedia op Wikidata ook nog allerlei uitbreidingen hebt. Ik heb meteen een aantal handige dingen aangezet, waaronder dat samenvoegen. Mijn dank is groot, Mbch331! 🙂 Mondo (overleg) 21 jun 2023 14:26 (CEST)[reageren]

Uitbreidingen is altijd site specifiek. Op enwiki kan je daar weer andere dingen tegenkomen als op nlwiki. En op commons ook weer andere. Mbch331 (overleg) 21 jun 2023 14:37 (CEST)[reageren]

Klopt, op EN:WP is veel meer beschikbaar dan op NL:WP. Die heb ik ook allemaal ingesteld (en ook DE:WP en CS:WP). Maar ik wist niet dat dat op Wikidata ook allemaal beschikbaar was. Goed om te weten! Mondo (overleg) 21 jun 2023 14:46 (CEST)[reageren]

Naast de uitbreidingen die via de Wikidata-interface beschikbaar zijn, zijn er ook nog een heleboel superhandige Wikidata user scripts die je kunt opnemen in je common.js pagina, zie bv. https://www.wikidata.org/wiki/User:OlafJanssen/common.js Groet, OlafJanssen (overleg) 23 jun 2023 11:39 (CEST)[reageren]

Sowieso altijd slim om de common.js van ervaren gebruiker te bekijken. Je weet nooit wat voor interessante scripts daar tussen staan. Mbch331 (overleg) 23 jun 2023 11:51 (CEST)[reageren]

Aan de ene kant wel. Maar aan de andere kant: het is wel vaak onduidelijk. Bijvoorbeeld in bovenstaand .js-bestand, wat doen al die scripts? Mondo (overleg) 23 jun 2023 11:57 (CEST)[reageren]

Veel scripts hebben documentatie op een wikipagina. Bijv. d:User:Bargioni/UseAsRef.js heeft documentatie op d:User:Bargioni/UseAsRef. Soms staat het boven een script waar je de documentatie kunt vinden. En soms is er inderdaad geen documentatie. ✔ Rots61 Overleg 23 jun 2023 16:51 (CEST)[reageren]

Ja, doe ik dus ook vaak, alles op mijn common.js is ook overgenomen van andere gebruikers. OlafJanssen (overleg) 28 jun 2023 12:25 (CEST)[reageren]

Amerikaanse advocaten gebruikten door ChatGPT verzonnen zaken

https://tweakers.net/nieuws/211116/amerikaanse-advocaten-gestraft-na-citeren-door-chatgpt-verzonnen-zaken.html

Zo zie je maar weer eens hoe belangrijk het is om kritisch te blijven. Reden te meer om ChatGPT-teksten op Wikipedia te weren. Mondo (overleg) 23 jun 2023 16:25 (CEST)[reageren]

Vergeet het. Dat weren houden we een paar maanden vol; in januari 2024 zijn de teksten al zo verbeterd dat we ChatGPT als auteur niet meer van andere Wikipedianen kunnen onderscheiden.

Beter kunnen we ons erop instellen dat we binnenkort amper zelf nog iets schrijven en het grootste deel van onze tijd spenderen aan het natrekken van geplaatste informatie. Nu al is het Nederlands van de chatbots veel beter dan dat van de meeste menselijke bijdragers.

Dat is op zich goed nieuws, maar het natrekken gaat steeds lastiger worden, want de informatieruimte (een favoriete term van ISW) zal in toenemende mate gevuld worden door subtiel bijgekleurde informatie; niet alleen teksten, maar ook foto's, infographics en video's worden onzichtbaar aangepast: terug naar de tijd waarin koningen en priesters vaststelden wat de waarheid was. Van schrijvers veranderen we in informatiemakelaars. Dat waren we altijd al, maar dat wordt de hoofdmoot. We moeten nu (gisteren, vandaag, morgen) gaan nadenken over de gereedschappen die we voor en door zo'n taakverschuiving nodig zullen hebben →bertux 23 jun 2023 17:02 (CEST)[reageren]

Eens dat de chatbots al beter schrijven dan de meesten en ook eens dat het onderscheid steeds moeilijker te maken zal zijn, zeker als we dat niet blind willen uitbesteden aan herkenningstools die zelf black boxes zijn. Maar waarom zouden we makelaars moeten worden van elders gefabriceerde en/of gemanipuleerde informatie? Voor mij bewijst het integendeel de onhoudbaarheid van de minimalistische opvatting van verifieerbaarheid ("ergens in de wijde wereld zijn er bronnen die staven wat hier staat, maar we hoeven ze niet te geven, zoek ze zelf maar"). Veel liever zou ik zien dat wij ons eindelijk engageren tot echte verifieerbaarheid (bronvermeldingsplicht) en dat het bouwen van een AI-encyclopedie daarnaast gebeurt. Ik sluit zeker niet uit dat de AI-versie ons kan overvleugelen, maar dan zal het op basis van verdienste zijn, en niet omdat we op voorhand hebben gecapituleerd. Karmakolle (overleg) 23 jun 2023 18:23 (CEST)[reageren]

Persoonlijk zou ik me er helemaal senang bij voelen als een chatbot een artikel zou schrijven op basis van door mij geverifieerde informatie en nog meer als hij zelf met goede bronnen aankomt. Dat kan ik niet als capitulatie zien. Maar inderdaad, het eerste gereedschap dat dan onmisbaar wordt is bronvermelding. Ook zou een snellere en betere versie van Wikiblame in de Wikimedia-software geïntegreerd moeten worden: je selecteert een tekstdeel en WikiWorth zoekt er de auteurs bij. Misschien moet daarnaast de kwaliteit van ieders schrijfwerk en zoekwerk handzaam samengevat worden, zichtbaar voor iedere ingelogde gebruiker, maar daarvan kan ik de consequenties niet goed overzien →bertux 23 jun 2023 18:50 (CEST)[reageren]

OK, dan spreken we over iets dat inderdaad integreerbaar kan zijn. Maar ik dacht begrepen te hebben dat die generatieve AI functioneert omdat hij gevoed is met gigantisch veel materiaal. Ik weet niet of je dit dan achteraf kan beperken tot een kleine selectie, terwijl het "fantaseren" in zijn DNA zit. Moet me dringend verder inlezen. Karmakolle (overleg) 23 jun 2023 19:11 (CEST)[reageren]

Met wat handige opdrachten kun je ChatGPT zo ver krijgen dat hij de bronnen onthult voor het rijp en groen waar het ding mee aan komt sjouwen, maar dan nog is ANNA de baas en de bot je assistent. Het fantaseren zit inderdaad in zijn DNA, maar de meeste informatie klopt, dat is het verleidelijke. Je moet het ding voeden met een lichte salade en twintig zweepslagen →bertux 23 jun 2023 19:24 (CEST)[reageren]

Anna is de baas, verleidelijk ... zweepslagen .. geen internet meer vandaag voor bertux. Schilbanaan (overleg) 23 jun 2023 19:26 (CEST)[reageren]

Net nu ik hem helemaal kon volgen 🤔 Karmakolle (overleg) 23 jun 2023 19:42 (CEST)[reageren]

Corrigeer me gerust, maar ChatGPT heeft geen bronnen te onthullen. Het is een model dat "gewoon" het volgende woord raadt, maar dat is nooit op een specifieke bron gebaseerd. Hoe goed het ook wordt, het zal per definitie onverifieerbaar blijven. Karmakolle (overleg) 25 jun 2023 00:30 (CEST)[reageren]

De WWT? tool? ~~uitbreiden, zodat hij ook werkt voor nlwiki, als dat afdoende werkt natuurlijk. Een ticket aanmaken in phabricator, zoals de tickets die op deze pagina staan, is zo gedaan.~~ ✔ Rots61 Overleg 23 jun 2023 19:20 (CEST)[reageren]

WWT? kende ik niet/vaag, meteen geïnstalleerd, maar de tickets die ergens zouden moeten staan zijn blijkbaar ondergronds gaan liggen →bertux 23 jun 2023 19:48 (CEST)[reageren]

De Phabricator links staan bij de vijfde bullet Bertux. Ciell need me? ping me! 23 jun 2023 20:16 (CEST)[reageren]

Nu wel, ja. Rots61 heeft de link gefixt →bertux 23 jun 2023 20:46 (CEST)[reageren]

Maarre, is dat ticket nog nodig? Bij mij werkt WWT? gewoon op nlwiki.

Voorbeeld: 'The Significance of Borders: Why Representative Government and the Rule of Law Require Nation States, waarop hij op 6 juni 2012 promoveerde. Een handelseditie verscheen later dat jaar onder de...

Info: JorisEnter (overleg | bijdragen) heeft dit op 28 november 2022 11:14 toegevoegd.

Deze persoon heeft minder dan 1% van de pagina geschreven.

Handig! 1000× vlotter dan Wikiblame! Het is minder een vervanging en meer een aanvulling, maar wat een mooie! →bertux 23 jun 2023 21:43 (CEST)[reageren]

De 'Who Wrote That?' tool werkt blijkbaar al voor nlwiki. Zelf had ik hem getest op de Engelstalige Wikipedia, daar werkte hij al goed. Handig dat hij hier ook werkt. ✔ Rots61 Overleg 23 jun 2023 22:03 (CEST)[reageren]

Kijk eens aan, dat werkt! Wikiblame heeft mij nooit enig resultaat getoond, deze wel. Dank voor de tip! Wammes Waggel (overleg) 24 jun 2023 18:16 (CEST)[reageren]

Een paar weken geleden was er in De Groene Amsterdammer een nogal verontrustend artikel te lezen over de Nederlandstalige chatbots. Die zouden zich maar al te vaak – en ook veel meer dan hun Engelstalige collega's – baseren op dubieuze websites, privacygevoelige informatie gebruiken en kranten helemaal leegtrekken, zonder daarvoor ook maar een cent te betalen en zonder die kranten zelfs maar als bron te vermelden.

Maar AI levert gelukkig ook onschuldig vermaak op. Sinds een paar maanden wordt YouTube overspoeld door kunstmatig gefabriceerde covers, waarvoor de stemmen van – vaak reeds lang overleden – artiesten worden gebruikt. Zo zingt een morsdode Freddie Mercury hier The Long And Winding Road van The Beatles, neemt Michael Jackson op zijn beurt Killer Queen van Queen voor zijn rekening en geeft Frank Sinatra zijn geheel eigen draai aan Coolio's Gangsta's Paradise. Niet van echt te onderscheiden, mijnheer. De wonderlijkste cover die ik tot nog toe hoorde is Bohemian Rhapsody in een uitvoering van Johnny Cash, die het nummer postuum volledig naar zijn hand heeft gezet. En het blijkt inmiddels ook al mogelijk te zijn om de computer een Bowie-achtig nummer te laten componeren, om dat vervolgens door de man zelf te laten zingen. Hier en hier zijn twee voorbeelden van een vroege Bowie te vinden, en hier is een nummer te horen dat hij wat later in zijn carrière had kunnen zingen. Nadeel is natuurlijk wel dat wanneer er een echte, tot nog toe onbekende demo van wie dan ook opduikt, niemand dat meer gelooft. — Matroos Vos (overleg) 24 jun 2023 20:11 (CEST)[reageren]

Allemaal heel knap natuurlijk, en ook best grappig. Maar uiteindelijk laten we onszelf als mens natuurlijk gewoon uitfaseren: we hoeven niet meer te kunnen schrijven, zingen, tekenen of componeren, maar we laten alles over aan ICT-ers en hun software. Hoogstens drukken we nog op wat knoppen en mogen we misschien het ondankbare controlewerk doen, zoals bronnencontrole. Ben ik blij dat ik vooral schrijf over niche-onderwerpen die in analoge boeken staan..... Heb ik voorlopig tenminste nog iets om mijn creatieve ei te kunnen leggen. Of gaan we zometeen een tegenbeweging zien, waarbij handwerk weer wordt gewaardeerd? Ondanks de vrijwel gratis online muziek zijn de concertzalen immers ook uitverkocht, en heel het land knutselt zich suf ondanks de stortvloed aan Actions en SoLows. Zelfs het aantal schrijvers is geëxplodeerd sinds boeken op uitsterven zouden staan. Thieu1972 (overleg) 25 jun 2023 09:59 (CEST)[reageren]

Niets nieuws onder de zon. Het kauwen en zacht maken van eten hebben we uitbesteed aan het vuur, evenals het verjagen van vijanden. Bruikbare tanden en nagels hebben we niet meer, want we hebben messen, speren en sinds een paar jaar ook kruisbogen en donderbussen. Een oerdamesroeiteam vaart rondjes om olympische kampioenen. Onze vacht hebben we vervangen door kleding, ons geheugen door de boeken die ons evenzeer uitgefaseerd hebben als de software nu doet. Trouwens, Wikipedia is een belangrijk onderdeel van die uitfasering. Onze evolutie naar een steeds hulpelozere staat is al miljoenen jaren aan de gang, hooguit heeft die 100.000 jaar, 300 jaar en 50 jaar geleden enorme stroomversnellingen doorgemaakt. Trouwens, de evolutie zelf besteden we deels uit aan genetische knutselaars.

Gebaseerd op een onvoorstelbaar gebruik van hulpbronnen zijn we in een razend tempo een steeds krappere ecologische cocon aan het spinnen en een vergelijking tussen het gentiaanblauwtje en de palmvarens, die kalmpjes de dino's zagen komen en gaan, leert dat dit een heilloze weg is. De route naar een technologische singulariteit kan een tijd leiden tot een steeds geavanceerdere techniek, maar brengt een kwetsbaarheid met zich mee. Zullen we ons redden, of zullen we geruisloos gaan de weg van alle vlees? Zullen de techneuten op tijd een minder hebberige opvolger van Homo sapiens in elkaar knutselen of moeten we elders kijken voor het volbrengen van een evolutionaire salto? De wappies voelen de ontwikkelingen beter aan dan meelopers in de hoofdstroom, het zou zomaar kunnen dat hun opvolgers ons voorlopig gaan redden →bertux 25 jun 2023 10:56 (CEST)[reageren]

Nee, want het is een niet-lineaire sprong die nu gemaakt moet worden, het moet of de volledige informatie van databases tot zichzelf nemen of toegang krijgen sub-queries uit te voeren op deze databases.

Beter liegen zal niet de benodigde informatie voor een referentie of een precedent toe kunnen voegen.

Het moet daarnaast ook een strikter idee krijgen van wat de juist inferenties en procedures zijn.

OP heeft gelijk wanneer ze aangeven dat er te veel hype is in "neural nets worden AGI". Bart Terpstra (overleg) 27 jun 2023 12:27 (CEST)[reageren]

Eigenlijk is het heel simpel. ChatGPT en aanverwante systemen zijn Large Language Models. Ze leren hoe taal eruit ziet maar weten niet daadwerkelijk wat het betekent. Stel je vraagt aan ChatGPT "Wat voor geluid maakt een hond?" dan gebuikt het systeem diens taalmodel om daarop een antwoord te genereren dat daarbij zou passen. Waarschijnlijk antwoordt het dan: "Woef", of "Een hond blaft."

Als je ChatGPT een juridische vraag stelt, dan zal het systeem dus ook op basis van dat taalmodel een natuurlijk klinkend antwoord daarop formuleren. Maar het is geen kennismodel. Het is ook geen zoekmachine. Dus het zuigt dan gewoon een paragraaf legalees uit de mouw, waarin dus inderdaad verwezen wordt naar "verzonnen" rechtszaken. Stel dat je ChatGPT zou vragen een Wikipedia-lemma te schrijven dan zal die een heel mooie tekst produceren die taalkundig klopt en heel geloofwaardig klinkt met perfect geformatteerde bornverwijzingen - die alleen naar alle waarschijnlijkheid pure onzin zullen zijn. Zo werkt het systeem nu eenmaal. Mx. Alba (die/hen/zij) (overleg) 25 jun 2023 01:39 (CEST)[reageren]

Ik moet mijn ChatGPT-account weer eens wakker kietelen. Van anderen begreep ik dat je de bot wel degelijk kunt vragen waar de antwoorden op gebaseerd zijn. Allicht komt hij dan met dingen die je zelf niet gevonden zou hebben en die best bruikbaar zijn →bertux 25 jun 2023 09:37 (CEST)[reageren]

De code onthoud het eigen vorige antwoord helaas niet. Als je het vraagt je te vertellen waar de antwoorden op gebasseerd zijn, zal het die vraag beantwoorden op dezelfde manier als de oorspronkelijke vraag: door te modelleren wat het meest waarschijnlijke antwoord is op zo'n soort vraag. Dat is ook hoe het bijvoorbeelt bronnen in wikipedia-artikelen hallucineert. Het model weet op basis van de database hoe een citatie geformatteerd is en hoe een geloofwaardige brontitel/link eruit ziet, maar het heeft geen database die het kan raadplegen om verificatie te doen. Het zal dus een geloofwaardige citatie maken die misschien zelfs naar een veelgebruikte betrouwbare bron verwijst. Maar van waar die link daadwerkelijk naar verwijst heeft het model geen enkel idee. Licks-rocks (overleg) 25 jun 2023 23:28 (CEST)[reageren]

Exact. Eigenlijk is ChatGPT dus gewoon een bullshitter eerstreklas. Geen leugenaar, omdat het de waarheid niet eens als concept erkent. Het zegt gewoon maar wat. Mx. Alba (die/hen/zij) (overleg) 26 jun 2023 14:47 (CEST)[reageren]

Ik begrijp wat jullie bedoelen. Het lijkt erop dat jullie reacties voornamelijk gebaseerd zijn op kennis over GPT-3.5 en niet over GPT-4.0. Het is belangrijk om te weten dat de nieuwe betaalde versie aanzienlijke verbeteringen heeft en zelfs plugins kan gebruiken om accurate bronnen te raadplegen voor het schrijven van artikelen. Wanneer ik een aantal artikelen aan de bot voorleg, kan GPT-4.0 een taalkundig correct en neutraal artikel genereren. Het begrijpen van hoe de prompts werken is hierbij cruciaal. Crazyphunk 26 jun 2023 15:00 (CEST)[reageren]

Neutraal is niet een objectieve kwaliteit maar het centrum van alle huidige editors.

Ook "correct" hangt af van de afstemming tussen alle editors over wat een feit is en wat een mening is, dit is ook niet objectief vast te stellen.

Het geven van editoriale krachten aan chatGPT zal wat "neutraal" en "correct" is veranderen om verscheidende redenen.

Een reden is dat het meer kan bewerken dan de menselijke bewerkers.

Een andere reden is dat Wikipedia niet een neutraal effect heeft op wat Wikipedia bestudeert, Wikipedia beïnvloed zelf het onderwerp wat het bestudeerd. Het kan hun eigen standpunt autoriteit/neutraliteit/objectiviteit geven door het te zeggen.

bvb een leugen door ommisie of een zaak met te veel zekerheid maken is zeer makelijk om te doen. Bart Terpstra (overleg) 27 jun 2023 12:37 (CEST)[reageren]

Zonder dat het subqueries uitvoert tegen databases zou het tegen informatietheorie ingaan om correcte antwoorden te kunnen geven, de grote van het programma zou de grote moeten zijn van [het hele internet/alle menselijk kennis] met een lossy-compressie slag er over heen. Bart Terpstra (overleg) 27 jun 2023 12:31 (CEST)[reageren]

Is deze laatste tekst ook door ChatGPT gegenereerd? Vinvlugt (overleg) 27 jun 2023 12:36 (CEST)[reageren]

Hoepel op? Bart Terpstra (overleg) 27 jun 2023 12:38 (CEST)[reageren]

Opmerking Voor Wikimedia & ChatGPT (bedreigingen, plannen), zie m:Talk:Wikimedia Foundation Annual Plan/2023-2024/Draft/Future Audiences →bertux 28 jun 2023 09:08 (CEST)[reageren]

Coördinator Schrijfwedstrijd – nieuwe poging!

Schrijfwedstrijd

Voor de Schrijfwedstrijd 2023 is er voor dit jaar nog een coördinator nodig! Wie wil en kan deze taak op zich nemen er wordt de opvolger van Dajasj? Laat het hier of op de overlegpagina van de wedstrijdpagina weten! StuivertjeWisselen (overleg) 27 jun 2023 12:09 (CEST)[reageren]

Het helpt misschien om een inschatting te geven van de hoeveelheid werk. Elly (overleg) 27 jun 2023 15:14 (CEST)[reageren]

Dajasj, Ciell, zouden jullie je ervaringen kunnen delen? StuivertjeWisselen (overleg) 27 jun 2023 16:37 (CEST)[reageren]

Hi! De voorbereidingen zijn misschien een middagje werk. Ik heb met Dajasj destijds enkele lijsten gedeeld die je kunt gebruiken als checklist e.d., geen idee of hij deze nog gebruikt heeft. Voor de rest was ik vooral procesbegeleider: zorgen dat de tijdslijn gevolgd wordt, en het bijvoorbeeld opnieuw op gang brengen van een discussie als deze stilgevallen is. In 2015 duurde het tot april voordat de uitslag er was, dat was wel heel erg lang, dus vandaar dat ik er altijd wat meer bovenop zat.

Verder ligt het ook aan de juryleden, hoeveel tijd en ruimte zij hebben om ook wat extra taken op te pakken. Sommige leden zijn heel voortvarend, anderen minder.

Wat denk jij @Dajasj, misschien een of twee uurtjes per week gemiddeld? Ciell need me? ping me! 27 jun 2023 21:33 (CEST)[reageren]

Eens, het kost aan het begin even middagje om wat voor te bereiden, en na de deadline kost het ook paar uurtjes. Tussendoor lijkt me een of twee uurtjes inderdaad redelijk. Het is vooral dat je inderdaad met regelmaat in de gaten moet houden dat het proces op schema ligt en dat er waar nodig overleg plaatsvindt tussen juryleden. Dajasj (overleg) 28 jun 2023 08:52 (CEST)[reageren]