Wikipedia:De kroeg/Archief/20190504

De lucht is blauw. Bron?

Wikipedia wil artificiële intelligentie inzetten om artikels beter te stofferen. Zelfs een feit zoals "de lucht is blauw" zou een bronvermelding behoeven. Op knack.be staat hierover een interessant artikel: Machine learning moet Wikipedia wijzen op bronnentekort. Ik vraag me af hoe we hier tegenover staan? Arch (Overleg) 20 apr 2019 19:00 (CEST)[reageren]

Overigens verwijst dat naar dit essay. Dat terwijl er ook een pagina over het tegenovergestelde te vinden is. Lijkt me dus wat overtrokken door de auteur van DataNews. Encycloon (overleg) 20 apr 2019 19:05 (CEST) Aangevuld op 20 apr 2019 22:00 (CEST).[reageren]

(Na BWC) Heel interessant onderwerp (en artikel). Ik denk dat 'we' als Wikipedia-gemeenschap daar niet eenduidig tegenover zullen staan. Mijn toekomsttheorie is dat Wikidata het kloppende hart van het Wiki-ecosysteem wordt en dat binnen een jaar of vijf een groot deel van artikelen op wikipedia's geschreven worden door Artifical Intelligence met data afkomstig van Wikidata en de structured data van Wikimedia Commons. Mij lijkt dat een goede en welkome ontwikkeling qua bijvoorbeeld (maar niet uitsluitend) neutraliteit en bronnengebruik. Ook al zie ik ook verschillende aandachtspunten (problemen zo je wilt) zoals bijvoorbeeld de (ook bij Artifical Intelligence en algoritmes op de loer liggende) 'systemic bias'. Maar wat mij betreft een van de ontwikkelingen waar de encyclopedie alleen maar beter van zal worden. Ecritures (overleg) 20 apr 2019 19:10 (CEST)[reageren]

Dan wel graag betrouwbare databasegegevens, anders krijg je dit soort problemen. Encycloon (overleg) 20 apr 2019 19:23 (CEST)[reageren]

Dat lijkt me een inkopper, niet waar? Ecritures (overleg) 20 apr 2019 20:34 (CEST)[reageren]

Je bedoelt voel je vrij en zorg er even voor dat alles op Wikidata op betrouwbare bronnen gebaseerd is? Bronnengebruik wordt als positief aspect genoemd, maar dat lijkt me vooralsnog meer een aandachtspunt dan een welkome ontwikkeling. Zodra dat verbeterd wordt (op Wikidata verplichte referenties naar betrouwbare, buiten-wiki-publicaties invoeren?) sta ik er echter zeker wel voor open. Encycloon (overleg) 20 apr 2019 21:45 (CEST)[reageren]

Dat wikipedia niet volmaakt is, daar kijkt niemand van op, maar als men bij toeval eens een fout constateert op wikidata lijkt de wereld te klein. Met regelmaat kom ik deze fout tegen, maar ik heb het besef, dat ook wikidata gevuld wordt door vrijwilligers. De oorzaak is eenvoudig. Als een WP lemma is geschreven heeft de auteur blijkbaar niet de moeite genomen, om goed te kijken of het wikidataelement bij een andere interwiki al is aangemaakt. Een kwestie van samenvoegen van de twee identieke elementen in wikidata is de oplossing. Ldhank (overleg) 20 apr 2019 21:26 (CEST)[reageren]

In het genoemde geval gaat het waarschijnlijk om een andere database dan Wikidata (al weet ik dat niet zeker). Waar ik een probleem mee heb, is dat je bij een artikel gebaseerd op Wikidata niet weet of je je indirect op een betrouwbare bron baseert of op iets wat - bij wijze van - ooit door een vandalistische gebruiker op een anderstalige Wikipedia is toegevoegd. En inderdaad wordt Wikidata gevuld door vrijwilligers, die ook weleens een fout maken of onbetrouwbare/geen bronnen gebruiken. Ervan uitgaande dat de inhoud van Wikipedia op betrouwbare bronnen gebaseerd moet zijn zie ik er dus helaas nog niet direct een positieve en welkome ontwikkeling in. Encycloon (overleg) 20 apr 2019 21:45 (CEST)[reageren]

Als je nu een artikel leest, weet je nog minder. Je weet misschien dat een artikel 1 bron heeft, maar vaak heb je geen idee voor welke feiten die bron is gebruikt, en welke overige feiten lang geleden door vandalen zijn toegevoegd. Op WikiData is dat in ieder geval een stuk duidelijker en gemakkelijker te controleren. Hier doen alsof WikiData straks de boel gaat verpesten, betekent (mijn mening) angst voor verandering, van mensen die eigenlijk niet weten waar we mee bezig zijn. Een bron vragen is leuk, maar 1 bron zegt eigenlijk helemaal niets. Maar dat probleem bestaat al zolang we WikiData hebben, en ik weet dat het in de begindagen van Commons niet veel anders was. Gelukkig weten de meeste gebruikers hier niet eens dat je hier ooit lokaal afbeeldingen kon uploaden (en dat dat ook dagelijks gebeurde), dus het is uiteindelijk gewoon een kwestie van tijd. Verders zegt Dagdeel hieronder wel heel zinnige dingen (mijn POV). Edoderoo (overleg) 21 apr 2019 20:36 (CEST)[reageren]

Nou niet helemaal. Als ik nu een nieuw artikel lees, mag ik van de auteur verwachten dat de informatie gebaseerd is op een betrouwbare bron - daar kan ik diegene eventueel op aanspreken.

Bij die ontwikkeling lijkt het - maar wellicht weet ik dan inderdaad niet genoeg af van waar 'jullie' mee bezig zijn - alsof je bij zo'n nieuw artikel maar moet hopen dat de informatie gebaseerd is op Wikidata-gegevens uit een betrouwbare bron. Encycloon (overleg) 21 apr 2019 21:03 (CEST)[reageren]

Een tekst die bijvoorbeeld geschreven is door AI of een artikel dat wordt bebrond door AI, wordt niet gebaseerd op 'informatie (die is) gebaseerd op Wikidata-gegevens'. Je moet Wikidata niet beschouwen als een gesloten database waar alleen gegevens in gezet worden. (En zeker niet als een database waarin alleen gegevens worden gezet door amateurs). Het belangrijkst aan een WD-item is waarschijnlijk niet eens de triple statements die bovenaan op het item staan. De nog belangrijker component (voor AI) zijn de identifiers onderaan een pagina waarmee linken worden gelegd met allerhande andere databases: van erfgoedinstellingen en bibliotheken, tot archieven en musea, van wetenschappelijke instituties tot andere encyclopedieën. Wikidata is geemn gesloten database maar een hub die het knooppunt vormt tussen duizenden andere databases. Dát is wat voor AI veel belangrijker is dan de data (de statements) in Wikidata. O.a. daarom is het zo belangrijk dat de data van Wikimedia Commons de komende tijd ook wordt 'omgevormd' tot structured data. Ik weet dat jij, @Encycloon, je ook veel bezighoudt met het belang van bronnen. Alleen daarom zou je eens kunnen kijken naar bijvoorbeeld het project WikiCite. Het geeft een eerste impressie waarom ik denk dat AI zeker kan gaan helpen bij het zoeken (en vinden!) van meer, betere en geschiktere bronnen. Dat lijkt mij wel degelijk een belangrijke verbetering voor wikipedia's. Ecritures (overleg) 21 apr 2019 21:31 (CEST)[reageren]

Oké, de identifiers dus in plaats van de statements (de eerdere discussie leek het daar niet over te hebben). Misschien toch maar meer in verdiepen dan, bedankt voor de toelichting. Encycloon (overleg) 21 apr 2019 21:41 (CEST)[reageren]

Als je voor iedere zin, of ieder zinsdeel of ieder (klein/voor de handliggend) feitje een referentie eis gaat het vertrouwen dat alles wel klopt achteruit in mijn ogen. Bronnen zijn niet onfeilbaar, en er zijn bronnen die heel hard dit beweren terwijl andere bronnen stellen dat... Bijvoorbeeld voor de hand liggende stelling, mensen zijn (nog) niet onsterfelijk' behoeft geen directe bron. Maar dat de mens onsterfelijk zou zijn dan weer wel... Als er echter een directe bron staat bij het eerste ga ik als lezer mij afvragen of het echt zo is, of is dat alleen een bepaalde bron dat beweerd..... Dagdeel (overleg) 20 apr 2019 20:46 (CEST)[reageren]

Het idee van dit algoritme is dan ook dat de 'bronbehoevende' beweringen eruit gefilterd worden. Zoals

hier op de derde pagina te zien is, kan een referentie gevraagd worden omdat iets een citaat lijkt, een statistiek, een potentieel controversiële bewering (bijvoorbeeld complottheorie), een mening/oordeel, een privégegeven of een specifiek wetenschappelijk of historisch feit dat niet algemeen bekend is. Encycloon (overleg) 20 apr 2019 21:52 (CEST)[reageren]

Dat kunstmatige intelligentie ons werk grotendeels gaat overnemen betwijfel ik. K.I. is goed in het verbanden leggen die wij niet eens vermoeden, maar dan kan niet eens uitleggen aan de mens met welke redenering hoe de K.I. aan zijn conclusies is gekomen. Een belangrijk aspect is het inschatten van de waarde van de bronnen. Dat is afhankelijk van de context en oordeel van de mens. In de gezondheidszorg is K.I. een goed hulpmiddel maar het uiteindelijk beslissing wordt genomen door de mens. Om een voorbeeld te noemen: Evolutie van de mens door gebrek aan hard bewijs zijn veel wetenschappelijke hypothesen speculaties waar geleerden met elkaar discuteren en proberen tot een consensus te komen. DE menselijk familieboom is constant aan revisie toe met nieuwe inzichten. Bij een bronnenonderzoek krijg je een wirwar van tegenstrijdige veronderstellingen waaruit je de essentie moet distilleren. En hoe ga je een gevoelig onderwerp zoals het Palestijn/Israël conflict behandelen? Zelf met bronvermelding is dit geen werk voor K.I. Uiteraard kan je een standaard artikel over een plaats straks misschien met K.I. generen, maar of het interessante artikelen worden betwijfel ik. Het is juist de bijzondere dingen/aspecten over een onderwerp die het interessant maken. Een database is maar saai omdat je juist de menselijke creativiteit gaat missen. Wij zijn meer dan een database, wij proberen ook de kennis toegankelijk te maken met goed geschreven artikelen.Smiley.toerist (overleg) 20 apr 2019 22:55 (CEST)[reageren]

Die plaatsartikelen bestaan al, dan wordt het iets als dit (het zal wellicht uitgebreider kunnen). Ik ben het met je eens dat ik beschrijving van minder triviale aspecten en bronnenafweging niet zo snel zie worden overgenomen door machines. Maar het lijkt niet onmogelijk dat dat in de nabije toekomst wel zal kunnen. Encycloon (overleg) 20 apr 2019 23:14 (CEST)[reageren]

Misschien kunnen collega's als Ecritures beter een andere hobby zoeken. Een encyclopedie probeert verschijnselen te beschrijven en van context te voorzien, robotlemma's gegenereerd vanuit wikidata hebben geen enkele functie. Peter b (overleg) 21 apr 2019 00:44 (CEST)[reageren]

Heerlijk op de inhoud weer zoals we gewend zijn van jou de laatste tijd. Misschien lees je je eerst eens in over AI: da's namelijk iets volledig anders dan 'robotlemma's gegenereerd vanuit wikidata'? Als je nu de volgende keer eens vanuit kennis en de inhoud reageert dan volgt er misschien een discussie die ergens over gaat. Als je het niet erg vind reageer ik verder niet op dit soort idiote losse flodders over hobby's die ik (bijvoorbeeld) van ene Peter b wel of niet zou moeten kiezen. Ecritures (overleg) 21 apr 2019 01:05 (CEST)[reageren]

Hier, kun je in plaats van gratuite opmerkingen over collega's je inhoudelijk in de materie verdiepen. Maar wel snel zijn, anders schrijft over vijf jaar AI artikelen over stations bijvoorbeeld, ik noem maar iets. Ecritures (overleg) 21 apr 2019 01:09 (CEST) Ach vooruit, het is Pasen. Ecritures (overleg) 21 apr 2019 01:11 (CEST)[reageren]

Dat is wat jij een discussie op de inhoud noemt? Laat dan inderdaad maar zitten. Peter b (overleg) 21 apr 2019 17:29 (CEST)[reageren]

Hier het bewijs dat je geen gelijkt hebt. Edoderoo (overleg) 27 apr 2019 14:00 (CEST)[reageren]

Ik ben bang dat het resultaat van de AI-scan zal zijn dat de Engelse Wiki, die toch al barst van de sjablonen en bronverzoeken, overspoeld wordt met nóg meer bronverzoeken, die jaren blijven staan omdat niemand weet wat hij ermee aan moet. Op de Engelse Wiki gelooft men in het dogma dat bronnen aan de bomen groeien en je ze alleen maar hoeft te plukken, maar in de praktijk valt het vinden van bronnen vaak helegaar niet mee. Ik kan daarover meepraten. Sijtze Reurich (overleg) 21 apr 2019 01:32 (CEST)[reageren]

Zolang wikipedia afhankelijk blijft van onbetaalde amateurs, zal wikipedia een rommeltje blijven waar iedereen blijmoedig zijn eigen hobby uitoefent. Hans Erren (overleg) 21 apr 2019 08:54 (CEST)[reageren]

Enige relativering is hier wel nodig. Ik heb in de professionele wereld al heel veel prutswerk door 'professionals' gezien. Denk maar aan de zoveelste project dat uitloopt zoals de Hoekse Lijn (en iedereen kent talrijke voorbeelden). (Dure adviseurs met een boekenkast vol diploma's, die de verkeerde beslissing van de directie moeten dekken) De ruzies in de kroeg zijn openbaar en zouden in een professionele context niet zichtbaar zijn (De baas treed dan op), maar ruzies binnen organisaties zijn even erg en veel mensen krijgen er een burn-out van. Onbetaald kan ook betekenen dat mensen goed gemotiveerd zijn en dat ze het niet alleen doen 'omdat het hun werk is'. Mensen die veel tijd en passie in een kennisonderwerp steken, weten vaak meer dan professionals. Het grote nadeel is dat amateurs soms doordraaien en niet kunnen relativeren. Het beste is als ze samenwerken in een kennisgroep waarbij ze elkaar kritisch kunnen beoordelen. (Net als bij de wetenschap) Nee, ik schaam mij niet om een onbetaalde amateur te zijn. Het Wikipediawerk is ondertussen mijn hoofdactiviteit geworden.Smiley.toerist (overleg) 21 apr 2019 11:17 (CEST)[reageren]

Zeker, het kan werken maar dan moet er ruimte zijn voor (constructieve) kritiek en een algemeen streven naar kwaliteit boven kwantiteit. Informele 'richtlijnen' als WP:VER en WP:BVB zouden best wat meer gewicht mogen hebben. Encycloon (overleg) 21 apr 2019 11:58 (CEST)[reageren]

Raar. Alsof mensen die betaald worden geen fouten maken en alsof een professional altijd over alle kennis beschikt. Bij dit project gaat het er juist om dat mensen samenwerken en hun kennis delen, zodat we met z'n allen een fatsoenlijke bron van kennis in elkaar zetten. Dat het hier en daar mis gaat kan simpelweg niet anders, maar dat moet je accepteren met de omvang van een project als WP. Schilbanaan (overleg) 22 apr 2019 13:41 (CEST)[reageren]

Dat wordt een zootje als een bot een aantal linken met wat AI moet gaan opzoeken en bij de lemma's stoppen. Bronnen hebben nooit dezelfde waarde of belangwekkende herkomst. Daar zal flink over gedebatteerd gaan worden. Daarbij zitten dus ook een hoop bronnen die de ene gebruiker accepteert en de andere gebruiker weer niet en weer fluks weg gaat halen. Het streven zal zijn om een bot te scheppen die zelf complete artikelen binnenhaalt, scant om de foutjes eruit te vissen, vertaalt en deze vervolgens gaat plaatsen. Zo kunnen we dus simpel alle Wiki's gelijkvormig maken. Pieter2 (overleg) 23 apr 2019 01:27 (CEST)[reageren]

Willen wij alle Wiki's gelijkvormig maken? Ik vind het juist handig dat ik in meerdere talen informatie kan opzoeken en er verschillende accenten en informatie beschikbaar is. Meer kansen dus. Nee voor mij geen eenheidsworst behalve voor de basisgegevens.Smiley.toerist (overleg) 23 apr 2019 10:28 (CEST)[reageren]

De gemiddelde Nederlandse gebruiker heeft geen zin de Engelse, Franse, Duitse of Spaanse Wiki te bezoeken om een hiaat aan info aan te vullen. En ook wordt er driftig 'vertaalt' uit al die diverse Wiki's. Zodat ook daar een zekere nivellering optreedt. Pieter2 (overleg) 23 apr 2019 22:56 (CEST)[reageren]

Ook vertalen gesproken: Wij moeten juist kijken waar wij meerwaarde hebben t.o.v. andere informatiebronnen. De wetenschappers gebruiken vaak hun eigen jargontaal, met veel geleerde woorden waar de betekenis precies is vastgelegd. Het vertalen en samenvatten daarvan in goed leesbare teksten is een pluspunt. Een voorbeeld: Bij Evolutie van de mens is er de zin: 'Een groot geboortekanaal en het efficiënt rechtop lopen gaat niet goed samen.' toe te lichten. Het lijkt simpel: Als de benen verder van elkaar verwijderd zijn met een brede heup, krijg je meer balansbewegingen (links, rechts) die gecorrigeerd moeten worden (en allerlei andere problemen). Op zich heb ik een goede bron gevonden, alleen krijg je zo een brei aan allerlei informatie die wel of niet relevant in deze context. Het is een hele kunst om een leesbare verklaring te geven, zonder een heel artikel te schrijven. Dit soort werk is belangrijk. Nu is het een beetje: hier heb je de bron zoek het maar uit.Smiley.toerist (overleg) 25 apr 2019 21:58 (CEST)[reageren]

Wat is er mis met iedereen blijmoedig zijn eigen hobby laten uitoefenen? Als een en ander verifieerbaar en neutraal is, moet er de gebruikers niets in de weg gelegd worden. — Zanaq (?) 26 apr 2019 17:57 (CEST)

Weer een gebruiker die lange reeksen bewerkingen doet maar niet reageert.

109.131.202.119 (overleg | bijdragen | verwijderde bijdragen | massaal verwijderen | logboek | blokkeren) heeft een lijst van 40(!) bewerkingen achter elkaar op pagina Beeldverhouding maar reageert niet op zijn OP. De laatste keer dat we dit aan de hand hadden resulteerde dit in de ene blokkade na de andere voor deze gebruiker. Moet dat deze gebruiker nu ook gebeuren? OXYGENE 7-13 (OVERLEG) 21 apr 2019 15:11 (CEST)[reageren]

Al opgelost, is reeds geblokkeerd. Dank voor alle reacties. OXYGENE 7-13 (OVERLEG) 21 apr 2019 16:32 (CEST)[reageren]

Los van dit specifieke geval: we gaan gebruikers niet blokkeren omdat ze goede bewerkingen doen. Het maakt niet uit of die bewerkingen in 1x of in 100x gedaan worden. Het maakt ook niet uit of men anoniem is. Men kan vriendelijk vragen de voorschouwing te gebruiken, maar als men dat niet doet, jammer dan. Ook geen leesblokkades. — Zanaq (?) 26 apr 2019 17:58 (CEST)

~~Waarom is dit geval dan wel geblokkeerd? Schilbanaan (overleg) 26 apr 2019 18:06 (CEST)~~[reageren]

Helemaal akkoord met Zanaq. Je mag niemand straffen voor goede bewerkingen. J.G.G. (overleg) 26 apr 2019 18:09 (CEST)[reageren]

Overlast veroorzaken is dus toegestaan? Er wordt niet voor niks aan sommige gebruikers gevraagd om hun werk met minder bewerkingen te verrichten. 100 kleine bewerkingen van soms nog geen 50 tekens moeten ook weer gecontroleerd worden, waardoor er dus flink extra werk ontstaat. Dqfn13 (overleg) 26 apr 2019 18:11 (CEST)[reageren]

Het is enigszins irritant, maar verder dan vriendelijk verzoeken om minder bewerkingen te doen gaat bij goede bijdragen te ver. J.G.G. (overleg) 26 apr 2019 18:14 (CEST)[reageren]

Er moet niet gecontroleerd worden: de door sommigen ervaren overlast ontstaat doordat we dat willen. — Zanaq (?) 27 apr 2019 06:49 (CEST)

Wat een gedoe om niets weer dit. Jammer, maar wel tekenend. De Wikischim (overleg) 26 apr 2019 18:12 (CEST)[reageren]

Alessandro Del Piero

Blijkbaar was Alessandro Del Piero in het nieuws gisteren, zijn pagina werd veel bekeken. Veel bekeken betekent ook een hogere kans op vandalisme, en/of meer gebruikers die gaan proberen of, en hoe, Wikipedia werkt. Maar ik zie dat dit nu ook garant staat voor het eeuwig dichtzetten van beweringen van zo'n pagina. Is het nu echt handig om na 2x vandalisme terugdraaien op een pagina maar gelijk de hele pagina voor OT te beveiligen? En worden zulke beveiligingen niet meer, zoals vroeger, op een lijst gemeld? Edoderoo (overleg) 26 apr 2019 09:30 (CEST)[reageren]

Inderdaad idioot! Overigens is er werk voor Magere Hein, die de pagina voorgoed op slot gooide. Er staat: "Del Piero heeft nu al meer dan 270 doelpunten gemaakt in zijn carrière. Een ander record is dat ..." Inmiddels is hij gestopt en 270 is geen record, zie b.v. Pelé en Romario. HT (overleg) 26 apr 2019 09:48 (CEST)[reageren]

Het was netter geweest om iets beter in de geschiedenis van het artikel te duiken Edo. Dit is niet na 2x vandalisme direct OT beveiligd zoals jij hier suggereert. Sinds februari is dit artikel stelselmatig doelwit van vandalisme en een tijdelijke beveiliging van een week bleek niet afdoende. @HT, het artikel is semi-beveiligd en is door jou nog prima te bewerken. VJVEGJG en verbeter het artikel op de plekken die je zelf aan geeft. MatthijsWiki (overleg) 26 apr 2019 10:15 (CEST)[reageren]

Ik bedoelde een semi-beveiliging van een maand, ik heb kennelijk op de verkeerde knoppen geklikt. Inmiddels hersteld en excuus voor de vergissing. Met idiote grijns, Magere Hein (overleg) 26 apr 2019 10:17 (CEST)[reageren]

OK, shit happens, geen probleem. Het goede nieuws is dat dit geen "standaard werkwijze" is, want dan zouden we heel Wikipedia langzaamaan op slot zetten. Dat doe ik liever via blokkades over ip-addressen/ranges dan via artikelen, zoals we dat altijd al doen. Ik ben dus weer helemaal gerustgesteld. Edoderoo (overleg) 27 apr 2019 13:47 (CEST)[reageren]