Wikipedia:De kroeg/Archief/20130326


Toch even schrikken

bewerken

Als ik zelf de proef neem en een tijdje op 'willekeurige pagina' tik, schrik ik toch een beetje omdat ik dan 30 tot 70 procent van die artikeltjes van twee regels tref :( Overigens duikt er slechts heel zelden een 'volwassen' artikel op. Het lijkt er sterk op dat de Nl-talige Wikipedia de kampioen is van van de superkorte artikeltjes. Is er een manier om te weten te komen hoeveel botmatig aangemaakte artikelen er op de Nl Wikipedia staan? Beachcomber (overleg) 19 mrt 2013 17:53 (CET)[reageren]

Statistiek, neem een willekeurige steekproef die groot genoeg is en laat er wat wiskunde op los. De gemiddelde lengte v.h. artikel (in bytes, regels en/of woorden) kan je al een boel vertellen. Een botje moet niet zo moeilijk te maken zijn, als die al niet bestaan. De wiskunde kan je zelfs vertellen hoe groot de kans is dat je ernaast zit. Kleuske (overleg) 19 mrt 2013 18:00 (CET)[reageren]
Vanwege mijn getaldomheid moet ik me helaas beperken tot mijn primitief natte-vinger-systeem, Kleuske. Beachcomber (overleg) 19 mrt 2013 18:20 (CET)[reageren]
Is er een wiskundige in de zaal? Een bothead? Waar zijn de nerds als je ze nodig hebt? Kleuske (overleg) 19 mrt 2013 18:21 (CET)[reageren]
Sorry, kan ook niet helpen, stond een 5,6 voor ik mijn examen deed en haalde mijn eerste voldoende voor wiskunde tijdens het examen: een 6,4. Tot op heden weet ik nog steeds niet wat ik goed heb gedaan... Dqfn13 (overleg) 19 mrt 2013 18:26 (CET)[reageren]
Tja, veel van die botvodje komen hier weg: Gebruiker:RobotMichiel1972/Projecten. Onder meer zo'n 35.000 Franse gemeenten waarvan er waarschijnlijk 34.500 nooit door iets anders aangeraakt zijn dan een bot. The Banner Overleg 19 mrt 2013 18:32 (CET) ==> Ik voeg er af en toe wat toe. --Havang (overleg) 20 mrt 2013 00:02 (CET)[reageren]

Wat is nu het nut van deze (zich vaak vaak herhalende) discussie? Ik schrijf zelf ook liever langere artikelen, maar de bot-artikelen storen me helemaal niet (als de info die er in staat maar juist is). Het is toch niet zo dat je door de grote aantallen kleine artikeltjes de overige artikelen niet meer kan vinden? Dat zou wel zo zijn als het een ouderwetse encyclopedie op papier zou zijn. Dan zou je je wezenloos bladeren. Nu merk het je alleen als je op "willekeurig artikel" drukt. Druk daar dan gewoon niet op zou ik zeggen ;) Magalhães (overleg) 19 mrt 2013 19:01 (CET)[reageren]

Sorry, zag het wat laat. De stand op 31 januari 2013 (recentere analyse nog niet beschikbaar) was afgerond: 1.142.000 artikelen waarvan 652.000 handmatig en 490.000 met een bot aangemaakt. Dus 43 % is met een bot aangemaakt. Van de 490.000 waren er 207.000 van mijn hand en 143.000 van RobotMichiel1972.Joopwiki (overleg) 19 mrt 2013 20:23 (CET)[reageren]
Dat laatste wat Magalhães zei zou ik ook gezegd hebben als het niet Beachcomber was geweest die de eerste opmerking hierover maakte. Beachcomber is gewoon een heel nieuwsgierige gebruiker die graag wil weten hoe dingen werkelijk in elkaar zitten. Zelf klik ik nooit op "willekeurig artikel" uit angst dat ik iets tegenkom wat ik zou kunnen verbeteren en wat dat betreft staan er al zoveel artikelen op de lijst in mijn hoofd en die lijst wordt almaar langer.  Wikiklaas  overleg  19 mrt 2013 20:28 (CET)[reageren]
Ik vergeet een deel van de vraag nog te beantwoorden. Absoluut gezien is de NL wiki nr.1 met botmatige aanmaak, procentueel gezien gaan er nog circa 10 talen voor. Nog meer cijfertjes nodig?Joopwiki (overleg) 19 mrt 2013 20:30 (CET)[reageren]
Bedankt, Joopwiki, indrukwekkend aantal. Ik heb er overigens geen probleem mee, want in vergelijking met handmatige beginnetjes is de informatie van de botartikelen waarschijnlijk heel wat betrouwbaarder. Beachcomber (overleg) 19 mrt 2013 20:32 (CET)[reageren]
Ben trouwens erg blij met de artikeltjes over Franse gemeenten, die me al vaak gemakkelijk toegankelijke (Nederlandstalige) informatie hebben verschaft die ik nooit verwacht had op het net te zullen vinden. Een dankbare gebruiker 19 mrt 2013 20:46 (CET)[reageren]
Leggen die bots wel eerst aan de gemeenschap en een paar knappe koppen voor wát ze precies van plan zijn te gaan doen? Ik kom nogal eens foutjes of slordige dingetjes in botartikelen tegen, bijvoorbeeld percentages die steevast geschreven zijn als 4.7% of vreemd geplaatste punten of voetnoten, maar ik heb toch echt geen zin om dat 207.000 keer in 4,7% te gaan zitten veranderen, al heb ik dat in de loop der jaren toch een paar honderd keer gedaan. Dus eerst goed laten nakijken door een paar mensen wat zo'n bot van plan is op te schrijven, voordat er ongelukken gebeuren. Een vandaal die drie keer in de fout gaat, wordt geblokkeerd, maar een bot kan zomaar 207.000 keer ongestraft in de fout gaan. ErikvanB (overleg) 19 mrt 2013 21:22 (CET)[reageren]
Ja, zie Wikipedia:Meldingen botimport nieuwe artikelen. En mocht ik een fout hebben gemaakt zoals je hiervoor aangeeft, laat het dan even weten om mijn overlegpagina. Anders dan de vandaal herstel ik die wel en de vandaal niet.Joopwiki (overleg) 19 mrt 2013 21:40 (CET)[reageren]
Bedankt voor deze link, Joopwiki. Die had ik nog nooit gezien. Mvg, ErikvanB (overleg) 20 mrt 2013 01:00 (CET)[reageren]
Ook RobotMichiel1972 is altijd bereid echte fouten te herstellen. Overigens zullen veel botactiviteiten zich in de toekomst gaan verplaatsen naar wikidata, als centrale taal-onafhankelijke repository van basisfeiten. Updates van inwonertallen enzo hoeven dan niet meer hier met de hand te gebeuren. RobotMichiel1972 (overleg) 19 mrt 2013 21:59 (CET)[reageren]
En zo wordt Wikipedia steeds moeilijker toegankelijk voor nieuwelingen en steeds moeilijker bewerkbaar. Mischien onvermijdelijk maar daarom niet minder jammer.Kalsermar (overleg) 19 mrt 2013 22:13 (CET)[reageren]
Ik voeg nog wel eens wat info aan de franse artikeltjes toe; maar het zijn er zo véééél. Weten jullie dat de fransen er als de kippen bij zijn om bij iedere kleine wiki al die gemeentes per bot toe te voegen: dan zie ik die bots runnen met interwikis. Enige tijd later zie ik de bots opnieuw langskomen: dan worden van de franse plaatsartikelen de interwiki's weer verwijderd. Fun... --Havang (overleg) 20 mrt 2013 00:02 (CET)[reageren]
  ErikvanB (overleg) 20 mrt 2013 01:00 (CET)[reageren]
Dat fouten herstellen via Wiki Data kan nog wel eens voor problemen gaan zorgen, hier gaan de duizendtallen met een punt, in het Engels juist met een komma, of kan dat ook aangepast worden? Dqfn13 (overleg) 20 mrt 2013 00:30 (CET)[reageren]
Dat vraag ik me ook af. Dat wordt dan een heel ingewikkeld regex-scriptje of zo. ErikvanB (overleg) 20 mrt 2013 01:00 (CET)[reageren]
Ergens bij de hulpmiddelen voor tabellen staat er een tool voor. Het kan zijn dat het in de Duitse wiki is. Ik knutsel daar aan een tabel en moet het nog een keer terugvinden. Stunteltje (overleg) 20 mrt 2013 07:55 (CET)[reageren]

Hier de gevraagde wiskundige. Je moet niet naar die percentages kijken. Stel, we hebben zo'n 10 duizend goede artikelen en 90 duizend slechte botartikelen. Dan is maar 10% van de artikelen goed, en dat klinkt weinig. Stel nu, de bot had niet gedraaid: dan hadden we nog steeds 10 duizend goede artikelen. Niks aan veranderd. En dat zijn de artikelen die gelezen worden.Een stuk tekst dat niemand leest, kan niet in de weg staan. Het is gewoon "raar" om via "willekeurige pagina" de encyclopedie te bezoeken. Als je een vakantie naar Frankrijk plant, ga je ook niet willekeurig een paar Franse plaatsen selecteren, maar ga je naar de plaatsen (Parijs, Marseille, etc.) die interessant zijn. Als we de discussie toch weer opnieuw voeren, wil ik best opnieuw pleiten voor het weghalen van de "willekeurig artikel"-link in het navigatiemenu. CaAl (overleg) 20 mrt 2013 08:32 (CET)[reageren]

Eens met CaAl. Ik wil wel eens statistieken zien hoe vaak Willekeurige pagina bezocht wordt. Goudsbloem (overleg) 20 mrt 2013 08:41 (CET)[reageren]
Hela hela, van mijn knopje afblijven! Beachcomber (overleg) 20 mrt 2013 08:43 (CET)[reageren]
Ik pleit niet voor het compleet weghalen van de knop; alleen voor het per default verbergen. De link blijft beschikbaar via Speciaal:SpecialePaginas, en voor gebruikers die in hun monobook hebben gezegd dat ze hem wel graag willen. CaAl (overleg) 20 mrt 2013 10:00 (CET)[reageren]
Ik wilde iets schrijven over die "willekeurige pagina"-knop, maar CaAl was me al voor. Die knop kan best een leuke manier zijn om door de encyclopedie te bladeren, maar de vraag is of de lezer die deze functie gebruikt geïnteresseerd is in botartikelen. Is het niet een idee een technicus te vragen de knop zo aan te passen dat alleen artikelen groter dan 10kb opduiken, liefst niet met namen die beginnen met "lijst van"? Technisch moet zoiets toch mogelijk zijn. Zo niet dan kan ik me wel vinden in CaAl's suggestie de knop maar helemaal te verwijderen. Woudloper overleg 20 mrt 2013 08:44 (CET)[reageren]
"Willekeurig bladeren" niet gebruikt? Vroeger... toen een encyclopedie nog uit 20 lijvige boekenkastvullende delen bestond, trok ik wekelijks een willekeurig deel uit de kast en sloeg die op een willekeurige plaats open. Voor mij de ideale manier om eens iets te lezen over een onderwerp waarvan je het bestaan niet vermoedde. Die knop is daar het digitale evenwicht van. Ik zou het zonde vinden, mocht die knop sneuvelen, ook al vind je vaak een botartikel. M.vr.gr. Brimz (overleg) 20 mrt 2013 10:10 (CET)[reageren]
Net even een paar keer (28x) geklikt op Willekeurig artikel. Gemiddeld 2.8 keer klikken om een artikel te vinden dat (met mijn instellingen) meer dan schermvullend was, dwz waarbij de categorieën buiten beeld vallen. (Canet-en-Roussillon (4), Niederscheidweiler (3), Nederrijns voetbalkampioenschap 1927/28 (1), Implosion (4), Bourg-de-Visa (1), Sminthopsis macroura (5), Sint-Joriskerk (Eindhoven) (2), Poëtische Edda (3), Lijst van Nederlandse staatssecretarissen van Justitie (2), Haaksbergen (3)) — Zanaq (?) 20 mrt 2013 10:40 (CET)
Net even een willekeurig deel van mijn nog uit 20 lijvige boekenkastvullende delen bestaande papieren encyclopedie opengeslagen. Van 25 opeenvolgende bladzijden noteerde ik het volgende lijstje met het aantal titels per bladzijde: 7, 3, 5, 9, 4, 3, 8, 7, 0, 2, 9, 8, 7, 6, 3, 4, 0, 0, 5, 5, 6, 2, 1, 11, 3. Van de in totaal 118 bekeken titels was maar 1 artikel meer dan 2 bladzijden (de twee opeenvolgende nullen in het lijstje), 1 artikel was meer dan 1 bladzijde (de enkele nul in het lijstje) en de rest was minder dan 1 bladzijde.
De test nog maar eens herhaald door 50 opeenvolgende bladzijden uit een ander willekeurig opengeslagen deel te bekijken, met als resultaat het volgende lijstje van aantal titels per bladzijde: 6, 5, 6, 6, 7, 4, 5, 5, 7, 3, 0, 4, 2, 3, 1, 5, 6, 7, 5, 6, 4, 0, 2, 4, 7, 6, 9, 8, 2, 0, 0, 0, 4, 1, 0, 3, 8, 4, 6, 7, 6, 5, 3, 11, 7, 7, 4, 8, 1, 3, 3. Van de in totaal 226 bekeken titels was maar 1 artikel meer dan 3 bladzijden, 3 artikelen meer dan 1 bladzijde, en de rest was minder dan 1 bladzijde.
Gemiddeld 4,6 artikelen per bladzijde. Bij 1000 woorden per bladzijde is dat gemiddeld 217 woorden per artikel. Bij 6 letters per woord is dat gemiddeld 1300 letters per artikel.
Meerdere artikelen bestonden uit slechts een enkele zin, en zouden niet aan onze eisen voor beginnetje voldoen. Doen we het hier dan zoveel slechter dan een "echte" encyclopedie?
Misschien moeten we denken of het interessant is om behalve de knop Willekeurige pagina ook nog knoppen met Volgende pagina en Vorige pagina aan te bieden. Na op een willekeurige pagina te zijn beland (willekeurig deel opengeslagen/willekeurige pagina geklikt) kun je dan vooruit en achteruit door de artikelen bladeren, op alfabetische volgorde, zoals je dat ook in een papieren encyclopedie zo fijn kunt doen   Trewal 20 mrt 2013 12:37 (CET)[reageren]
Dat vond ik wel een geinig idee, dus ik heb een tooltje gemaakt waarmee je vooruit en achteruit door de artikelen [kunt] bladeren, op alfabetische volgorde, [bijna] zoals je dat ook in een papieren encyclopedie zo fijn kunt doen. — Zanaq (?) 20 mrt 2013 13:52 (CET)
Geinig tooltje. De Kroeg zit tussen De kristallen grot (Jommeke) en De kronieken van Narnia in. CaAl (overleg) 20 mrt 2013 15:00 (CET)[reageren]
Die functie werkt nu niet meer. — Zanaq (?) 20 mrt 2013 15:06 (CET)
Leuk tooltje, alleen als je op een artikel komt en erna zit een redirect van dat artikel, kom je niet verder, zie als voorbeeld Sediment, daarna komt de redirect ervan, Sediment (natuur). Kun jij dat nog aanpassen, Zanaq? Goudsbloem (overleg) 20 mrt 2013 15:01 (CET)[reageren]
Misschien de redirects overslaan op de een of andere manier, want even verderop kom ik op Sedimentair, en spring ik terug naar Sediment. Goudsbloem (overleg) 20 mrt 2013 15:04 (CET)[reageren]
Dank je. Aan zo'n redirectfunctie zat ik ook te denken, maar dacht toen, klik gewoon op de link naar de redirect eronder, en ga van daaruit verder. Maar misschien maak ik toch nog een functie om 1 klik minder te hebben.... — Zanaq (?) 20 mrt 2013 15:06 (CET)
Bedankt, Zanaq, leuk tooltje! Zo leidt de schrikreactie van Beachcomber toch tot leuk nieuw speelgoed voor iedereen :D Trewal 20 mrt 2013 15:15 (CET)[reageren]
Wow! Leuke tool! Respect! [[Bestand: :Y2.svg|25px|]]Beachcomber (overleg) 20 mrt 2013 15:28 (CET)[reageren]
Huh? Waar, waar, waar..??   Hebbe, hebbe! ErikvanB (overleg) 21 mrt 2013 08:14 (CET)[reageren]
Super cool! Maar is het mogelijk om de redirectpagina's er tussen uit te halen?? Want nu zitten er nog in en spring je soms naar een totaal andere letter. Kan niet helemaal de bedoeling zijn lijkt mij.   Druyts.t overleg 20 mrt 2013 17:15 (CET)[reageren]
Met bladeren door een papieren encyclopedie sla je de zies ook niet over. Alleen wordt je er niet automatisch heengeleid. Een oplossing is nog in de maak, voorlopig kun je op de link naar de redirectpagina doorklikken. — Zanaq (?) 20 mrt 2013 19:34 (CET)
Ik heb nog wat extra functies ingebouwd, onder andere om redirects over te kunnen slaan, en om een navigatiemenu te tonen. Zie de handleiding voor informatie hoe je het voor jezelf kunt instellen. — Zanaq (?) 21 mrt 2013 15:35 (CET)

Punten en komma's in getallen

bewerken

De discussie in "Toch even schrikken" gaat alle kanten op; daarom maak ik maar even een nieuw kopje aan. Inderdaad geven punten in het Nederlands de duizendtallen aan en in het Engels de decimalen, terwijl het voor de komma's net omgekeerd is. Maar is dat een ernstig probleem? Als Wikidata beweert dat Leiden 105,743 inwoners heeft, is die stad dan in last? Wie denkt dan dat er daar 105 complete mensen wonen en nog eentje voor bijna driekwart? Als er een voorbeeld is van een serieuze mogelijke verwarring tussen duizendtallen en decimalen, dan hoor ik dat graag. DrMennoWolters (overleg) 20 mrt 2013 18:18 (CET)[reageren]

Het gaat natuurlijk niet alleen over verwarring. Als dat het enige criterium zou zijn, dan hadden we ook alle regels voor correcte spelling en stijl wel overboord kunnen gooien. De verwarring kan overigens wel degelijk optreden bij grote getallen waar niet direct een goed referentiekader is. Als bedrijf X een winst draait van "32,546 miljoen", wordt het al wat lastiger dan bij Leiden. Paul B (overleg) 20 mrt 2013 18:44 (CET)[reageren]
Ja, ik voel de bui al hangen, vooral als er biljoen staat! Maar ik vermoed dat dit toch vrij zeldzaam zal zijn, omdat er niet zo vaak precies drie decimalen zullen staan. Mocht het niet lukken een geschikte bot of andere geautomatiseerde oplossing te vinden, dan zullen we ons best moeten doen om in de aard van de gegevens in Wikidata dubbelzinnigheden te vermijden. Dus daar zal het getal 32,546 miljoen niet mogen voorkomen: hetzij 32,5 miljoen, hetzij 32,5 miljard (= billion!), of voluit 32,546,324 euro met foute komma's maar wel duidelijk. DrMennoWolters (overleg) 20 mrt 2013 19:04 (CET)[reageren]
Is het niet de bedoeling dat in Wikidata gegevens staan zonder een specifieke representatie van die gegevens op te leggen? Ik kan me voorstellen dat dat nu niet mogelijk is, maar het zou n.m.m. wel het doel moeten zijn. Paul B (overleg) 20 mrt 2013 19:06 (CET)[reageren]
Begrijp me goed, ideaal is natuurlijk dat Wikidata feilloos punten en komma's aanpast naar gelang de gewoonten in verschillende taalgebieden. Maar mocht dat niet lukken, dan komen we een eind met voorschriften zoals ik hierboven uit mijn mouw schud en met wat begrip voor foute punten en komma's. Er zijn voorlopig ernstiger problemen, zoals bepaalde routefiguren die in Wikipedia wel en in Wikivoyage niet kunnen worden weergegeven (zie voor een voorbeeld Wandelroute E2 in allebei; onderaan het WP-artikel zit

GEEN directe link naar het WV-artikel). DrMennoWolters (overleg) 20 mrt 2013 19:20 (CET)[reageren]

Excuus, hier is de link: https://nl.wikivoyage.org/wiki/Wandelroute_E2 DrMennoWolters (overleg) 20 mrt 2013 19:45 (CET)[reageren]
Ja, dat krijg je met die luxe sjablonen - die moet je op ieder project weer opnieuw definiëren. Hetzelfde probleem als wanneer mensen dit soort dingen integraal van de Engelstalige Wikipedia naar de Nederlandstalige willen overhalen. Een centrale sjablonendatabase zal weer een hele nieuwe klasse problemen oproepen, vrees ik. Paul B (overleg) 20 mrt 2013 19:49 (CET)[reageren]
Zou herschrijven van de betreffende sjablonen in die nieuw aangeboden taal Lua dit kunnen oplossen? FredTC (overleg) 21 mrt 2013 08:28 (CET)[reageren]
Als Wikidata een instelling heeft om aan te geven dat een veld getallen bevat, zou het verder geen enkel probleem moeten opleveren. Als ik hier (in de VS) in Excel een spreadsheet aanmaak met 16,768,235 en ik stuur dat naar iemand in Nederland en die opent dat bestand, dan ziet hij/zij vrolijk 16.768.235, zonder dat iemand daar iets voor heeft moeten doen. W\|/haledad (zegt u het maar) 21 mrt 2013 05:24 (CET)[reageren]

omdraaien redirect

bewerken

Dit komt niet vaak voor maar: "TreinTramBus" is nu de officiële naam van de Belgische reizigersvereniging. De oude naam "Bond van Trein-, Tram- en Busgebruikers" mag niet meer gebruikt worden. Die moet omgezet worden in een redirect naar de nieuwe naam. Een redirect van de afkorting TTB is ook handig. Kan iemand dat op een handige manier technisch uitvoeren? Smiley.toerist (overleg) 21 mrt 2013 11:08 (CET)[reageren]

Dat kun je hier aanvragen. Groetjes, Grashoofd 21 mrt 2013 11:13 (CET)
Ga je het artikel ook nog wat neutraliseren? The Banner Overleg 21 mrt 2013 11:33 (CET)[reageren]
Ik heb de koptekst aangepast. Verder weet ik niet wat je bedoelt met neutraliseren. Teveel promo? Het is niet te vermijden dat als de doelstellingen van de organisatie vermeld worden er enige promotie inzit, maar dit is wel inherent aan het onderwerp. Kan je volstaan met wat vage kreten, dat de organisatie reizigersbelangen behartigd?Smiley.toerist (overleg) 21 mrt 2013 12:47 (CET)[reageren]

PS: Ik heb van de gelegenheid gebruikt gemaakt om een nieuw artikel te schrijven: Europese Reizigersfederatie. In de categorieën zie ik niet niets onder Europese organisaties of verenigingen. Dat is allemaal gecategoriseerd per land.Smiley.toerist (overleg) 21 mrt 2013 12:47 (CET)[reageren]

  Uitgevoerd. Ook de links zijn nu aangepast. Een dp voor de afkorting TTB is toegevoegd.Smiley.toerist (overleg) 21 mrt 2013 14:13 (CET)[reageren]