Ich verwende inzwischen für fast alle Abfragen entweder das Datenbank-Abfrage-Tool unter http://wikisign.org/ oder meine Titel-Suche under http://dstadler.org/grepwikititle.php
Viele andere Seiten mit Abfragen sind hier gelistet: Benutzer:SirJective/Seiten_mit_Datenbank-Abfragen
Bitte gewünschte Anfragen auf dieser Seite stellen.
siehe http://dstadler.org/grepwikititle.php
Schnelllöschung:
((Löschen)) ''Falsches Lemma, keine Verweise mehr auf diesen Artikel'' --~~~~ ----
Selektiere die Anzahl der Sätze aus pagelinks bei denen der Ziel-Artikel nicht vorhanden ist, gruppiert nach Namespace.
SELECT p.pl_namespace, COUNT(*) AS Anzahl, "<br/>" FROM pagelinks p, cur c1 WHERE NOT EXISTS ( SELECT * FROM cur c WHERE c.cur_namespace = p.pl_namespace AND c.cur_title = p.pl_title ) GROUP BY p.pl_namespace ORDER BY Anzahl DESC LIMIT 500
Ergenibs:
Selektiere Sätze aus pagelinks bei denen der Ziel-Artikel nicht vorhanden ist und ein bestimmtes Sonderzeichen im Titel vorkommt.
SELECT CONCAT('[http://de.wikipedia.org/w/index.php?title=Spezial:Whatlinkshere&target=', replace(replace(replace(p.pl_title,"'","%27"),'"','%22'),'\\','%5C'), ' ', p.pl_title,'] ') AS Artikel, COUNT(p.pl_title) AS Anzahl, "<br/>" FROM pagelinks p, cur c1 WHERE (p.pl_title LIKE '%!%' OR p.pl_title LIKE '%&%' OR p.pl_title LIKE '%*%' OR p.pl_title LIKE '%$%' OR p.pl_title LIKE '%@%' OR p.pl_title LIKE '%#%' OR p.pl_title LIKE '%^%' OR p.pl_title LIKE '%+%' OR p.pl_title LIKE '%=%' OR p.pl_title LIKE '%:%' OR p.pl_title LIKE '%;%' OR p.pl_title LIKE '%,%' OR p.pl_title LIKE '%\%' OR p.pl_title LIKE '%?%' OR p.pl_title LIKE '%<%' OR p.pl_title LIKE '%>%' OR p.pl_title LIKE '%|%' OR p.pl_title LIKE '%[%' OR p.pl_title LIKE '%]%' OR p.pl_title LIKE '%{%' OR p.pl_title LIKE '%}%') AND c1.cur_id = p.pl_from AND c1.cur_is_redirect = 0 AND c1.cur_namespace = 0 AND NOT EXISTS ( SELECT * FROM cur c WHERE c.cur_namespace = p.pl_namespace AND c.cur_title = p.pl_title ) GROUP BY p.pl_title ORDER BY Anzahl DESC, p.pl_title ASC LIMIT 500
Ergebnis:
Ähnlich wie Benutzer:Bananeweizen/Nicht_vorhandene_Artikel_mit_Sonderzeichen_am_Anfang, jedoch an neue Tabellenstruktur angepasst.
Selektiere alle Sätze aus pagelinks bei denen der Ziel-Artikel nicht vorhanden ist und gruppiere sie nach Titel.
SELECT CONCAT('[http://de.wikipedia.org/w/index.php?title=Spezial:Whatlinkshere&target=', replace(replace(replace(p.pl_title,"'","%27"),'"','%22'),'\\','%5C'), ' ', p.pl_title,'] ') AS Artikel, COUNT(p.pl_title) AS Anzahl, "<br/>" FROM pagelinks p, cur c1 WHERE p.pl_title NOT REGEXP '^[[:alnum:]]' AND p.pl_title NOT IN ('!Kung', '(Artificial_Intelligence)', '?uestlove', '*BEN*', '!anda!', '!Kwi', '@Large', '(A)live In Concert 97', '(Best LIVE) (James Taylor)', '(LIVE) (James Taylor)', '(The Death Of) Anna Karina', '(Welcome To) Sky Valley') AND c1.cur_id = p.pl_from AND c1.cur_is_redirect = 0 AND c1.cur_namespace = 0 AND c1.cur_title NOT IN ('Liste_historischer_Flugzeugträger') AND NOT EXISTS ( SELECT * FROM cur c WHERE c.cur_namespace = p.pl_namespace AND c.cur_title = p.pl_title ) GROUP BY p.pl_title ORDER BY Anzahl DESC, p.pl_title ASC LIMIT 500
Das Ergebnis dieser Abfrage ist hier verfügbar:
alle überprüft...
SELECT cur_namespace, cur_title, cur_timestamp FROM cur WHERE cur_title not in ('Gustav König') AND cur_text like '%Thaeter%' LIMIT 100
alle erledigt
Selektiert Daten in einem Format das mit DOT (http://www.graphviz.org/) zu einer netten Graphik verarbeitet werden kann.
SELECT DISTINCT concat('"',c1.cur_title,'"->"',c2.cur_title,'"') FROM cur c1, cur c2, links l WHERE c1.cur_id = l.l_from AND c1.cur_namespace = 0 AND c1.cur_is_redirect = 0 AND c2.cur_id = l.l_to AND c1.cur_title = 'Oberkappel' LIMIT 500
SELECT DISTINCT concat('"',c1.cur_title,'"->"',c2.cur_title,'"') FROM cur c0, links l0, links l, cur c1, cur c2 WHERE c0.cur_title = 'Oberkappel' AND c0.cur_namespace = 0 AND c0.cur_is_redirect = 0 AND c0.cur_id = l0.l_from AND l0.l_to = l.l_from AND c1.cur_id = l.l_from AND c2.cur_id = l.l_to LIMIT 500
SELECT DISTINCT concat('"',c1.cur_title,'"->"',b.bl_to,'"') FROM cur c1, brokenlinks b WHERE c1.cur_id = b.bl_to AND c1.cur_namespace = 0 AND c1.cur_is_redirect = 0 AND c1.cur_title = 'Oberkappel' LIMIT 500
Artikel, die besonders viele "Brokenlinks" aufweisen, ausgenommen Artikel, die in einer Kategorie "Liste..." oder "Ort..." aufscheinen. Das Ergebnis zeigt einerseits Artikel, die in eine der Listen-Kategorien aufgenommen werden sollten und andererseits, welche normalen Artikel sehr viele Links auf nicht-vorhandene Artikel enthalten. Diese Artikel sind potentielle Artikel für ein Review, um herauszufinden, warum soviele fehlende Links enthalten sind.
SELECT concat('*[[',c1.cur_title,']]','<br>'), COUNT(*)
SELECT c1.cur_namespace, c1.cur_title, count(*) FROM pagelinks p, cur c1 WHERE c1.cur_namespace = 0 AND c1.cur_is_redirect = 0 AND c1.cur_id = p.pl_from AND c1.cur_text NOT LIKE '%[[Kategorie:Liste%' AND c1.cur_text NOT LIKE '%[[Kategorie: Liste%' AND c1.cur_text NOT LIKE '%[[Kategorie:Teilliste%' AND c1.cur_text NOT LIKE '%[[Kategorie: Teilliste%' AND c1.cur_text NOT LIKE '%[[Kategorie:Ort%' AND c1.cur_text NOT LIKE '%[[Kategorie: Ort%' AND c1.cur_text NOT LIKE '%[[Kategorie:Kommunen%' AND c1.cur_text NOT LIKE '%[[Kategorie: Kommunen%' AND c1.cur_text NOT LIKE '%[[Kategorie:Themenliste%' AND c1.cur_text NOT LIKE '%[[Kategorie: Themenliste%' AND c1.cur_text NOT LIKE '%((Navigationsleiste Liste%' AND NOT EXISTS ( SELECT * FROM cur c2 WHERE c2.cur_namespace = p.pl_namespace AND c2.cur_title = p.pl_title ) GROUP BY p.pl_from ORDER BY 3 DESC LIMIT 100
Ergebnise:
Das folgende SQL-Select ermittelt Kandidaten für den WikiReader Digest nach den vorgeschlagenen Kriterien.
$ARTIKEL wird durch ein kleines Script auf die Artikel aus der Liste unter Wikipedia:Archiv/WikiReader Digest/Artikelliste gesetzt und dadurch Artikel, die bereits in Readern vorgekommen sind, von der Auswahl ausgenommen. Außerdem wird die Artikelliste auf Redirekts überprüft und diese Artikel auch ausgeschlossen. Weiters werden Jahrestage und einige Artikel zu Jahren ausgenommen, weitere solche Kriterien können jederzeit aufgenommen werden.
select concat('*[[',cur_title,']]')
select cur_namespace, cur_title
select count(*)
from cur where cur_is_redirect = 0 AND cur_namespace = 0 AND LENGTH(cur_text) > 2000 AND cur_title NOT LIKE 'Portal:%' AND cur_title not in (
'1984_(Roman)', '2002_AA29', '3D-Foto', '42_(Antwort)', 'AIDS', 'Aarau', 'Abraham_Lincoln', 'Absarokee', 'Absatzlogistik', 'Acadia-Nationalpark', 'Aceh', 'Ada_(Programmiersprache)', 'Adam_Opel_AG', 'Adrian_Nastase', 'Afrikanische_Union', 'Afrikanischer_Wildhund', 'Airbus_A380', 'Al_Capone', 'Alan_Cox', 'Albert_Einstein', 'Albert_Pierrepoint', 'Albulabahn', 'Allgemeine_Relativitätstheorie', 'Alter_Jüdischer_Friedhof_an_der_Oberstraße', 'Anarchismus', 'Andy_Warhol', 'Angela_Merkel', 'Angriff_auf_Pearl_Harbor', 'Anne_Frank', 'Anonymität_im_Internet', 'Ansari_X-Prize', 'Antarktis', 'Apallisches_Syndrom', 'Apple_iPod', 'Argentinien-Krise', 'Arschbombe', 'Arthur_Rimbaud', 'Asiento', 'Atlantropa', 'Atombombenexplosion', 'Aufstand_der_Vendée', 'Augusta_von_Sachsen-Weimar-Eisenach', 'Augustinus_von_Hippo', 'Australian_Football_in_Nauru', 'Badekarre', 'Bahn_2000', 'Baikal-Amur-Magistrale', 'Baikalsee', 'Balkankonflikt', 'Banff-Nationalpark', 'Barrique', 'Bauhaus_Dessau', 'Bebop', 'Belagerung_von_Konstantinopel_(717–718)', 'Benedikt_XVI.', 'Benjamin_von_Stuckrad-Barre', 'Benoît_Mandelbrot', 'Berchtesgadener_Alpen', 'Bergpark_Wilhelmshöhe', 'Berlinale', 'Bermudadreieck', 'Bernhard_zur_Lippe-Biesterfeld', 'Bernstein', 'Besetzung_der_Hainburger_Au', 'Bier', 'Bilderrätsel', 'Biogas', 'Bleistift', 'Blue_Note_Records', 'Blue_Note', 'Borderline-Persönlichkeitsstörung', 'Brandmelder', 'Braunbär', 'Bretagne', 'Briançon', 'Britische_Ostindien-Kompanie', 'Brunegggletscher', 'Brunnen_(Motiv)', 'Bryce-Canyon-Nationalpark', 'Bud_Powell', 'Budapester_Thermalbäder', 'Bundestagswahl_2005', 'Bundesverfassungsgericht', 'Bundeswehr', 'Burren', 'Bülbüls', 'Calanda_(Berg)', 'Camera_obscura', 'Canadarm2', 'Canadian_Pacific_Railway', 'Cangaçeiro', 'Cape-Roberts-Bohrprojekt', 'Capsaicin', 'Carl_van_Vechten',_-_wurde_erweitert 'Cassini-Huygens', 'CeBIT', 'Charles_Manson', 'Charlie_Parker', 'Chemins_de_fer_de_la_Corse', 'Chesapeake_Bay', 'Chinas_Grüne_Mauer', 'Cholerabrunnen', 'Chop', 'Chorleitung', 'Christopher_Reeve', 'Christopher_Street_Day', 'Chuchichäschtli', 'Châteauneuf-du-Pape', 'Cliffs_of_Moher', 'Cochleaimplantat', 'Columbus_Raumlabor', 'Competitive_Intelligence', 'Connemara_Nationalpark', 'Connemara', 'Croagh_Patrick', 'Cupola', 'Côte_d''Ivoire', 'DVB-T', 'Dachgaube', 'Daguerreotypie', 'Damaszener_Stahl', 'Daniel_Boone', 'Darfur', 'Dayton-Vertrag', 'Deep_Thought', 'Depression', 'Der_Spiegel', 'Desoxyribonukleinsäure', 'Destiny_(ISS)', 'Deutsche_Lufthansa', 'Deutsche_Sprache_in_den_USA', 'Deutschschweizer_Gebärdensprache', 'Dhimmi', 'Didgeridoo', 'Die_Aktion', 'Die_Gesellschaft_des_Spektakels', 'Die_Welle', 'Dietrich_Bonhoeffer', 'Digital_Rights_Management', 'Diglossie', 'Dinner_for_One', 'Dizzy_Gillespie', 'Doppelbrechung', 'Doppler-Effekt', 'Dorama', 'Dorothea_Viehmann', 'Dostojewski', 'Douglas_Adams', 'Dresden', 'Dwight_Yorke', 'Dynastie_der_Saud', 'Déjà-vu-Erlebnis', 'EU-Kommission', 'Edvard_Munch', 'Eilean_Donan_Castle', 'Eintrittskarten_Fußball-Weltmeisterschaft_2006', 'Eisenerz', 'Eisenhutblättriger_Hahnenfuß', 'El_Niño', 'Electric_Tablet_System', 'Elfriede_Jelinek', 'Eliot_Ness', 'Elvis_Presley', 'Eminem', 'Enchiridion_Helveticum_Constantiae_Episcopalis', 'Engrish', 'Ephraim_Kishon', 'Erdbeben_im_Indischen_Ozean_2004', 'Erdbeben', 'Erfundenes_Mittelalter', 'Eric_Clapton', 'Erkältung', 'Erneuerbare_Energie', 'Erwin_Teufel', 'Esperanto-Literatur', 'Euro', 'Europäischer_Haftbefehl', 'Fahd_ibn_Abd_al-Aziz', 'Fanzine', 'Fastenzeit', 'Feinstaub', 'Felix_the_Cat', 'Felsenbad_Pottenstein', 'Fettmilch-Aufstand', 'Filmempfindlichkeit', 'Finnisches_Bildungssystem', 'First_Nations_University_of_Canada', 'Fish_and_Chips', 'Fjodor_Michailowitsch_Dostojewski', 'Flaggenstreit_zwischen_den_USA_und_Panama_1964', 'Flatted_fifth', 'Foo', 'Framework', 'Frankfurt_am_Main', 'Franklin_Pierce', 'Französische_Revolution', 'Frauenfeld', 'Frauenkirche_(Dresden)', 'Frauenwaggon', 'Freiheitsstatue', 'Freikörperkultur', 'Freimaurerei', 'Friedhof_der_Märzgefallenen', 'Friedrich_Schiller', 'Fruchtbringende_Gesellschaft', 'Frère_Roger', 'Frédéric_Auguste_Bartholdi', 'Frühsommer-Meningoenzephalitis', 'Frühstücksei', 'Fußball-Europameisterschaft_2004', 'Fußballeuropameisterschaft_2004', 'Fußballkrieg', 'Fußballnationalmannschaft_von_Trinidad_und_Tobago', 'Fête_des_Vignerons', 'Galileo_Galilei', 'Galveston-Hurrikan_(1900)', 'Gangesgavial', 'Gaza-Streifen', 'Gazastreifen', 'Gefangenenbibliothek', 'Gefleckter_Aronstab', 'Geflügelpest', 'Gemini_3', 'Geocaching', 'Georg_Milbradt', 'George_W._Bush', 'Gerhard_Schröder', 'Germanische_Mythologie', 'Geschichte_Monacos', 'Geschichte_der_Eisenbahn', 'Geschichte_der_Lufthansa', 'Geschichte_der_Stadt_Nürnberg', 'Geschichte_des_Libanon', 'Glaukom', 'Godwins_Gesetz', 'Goldene_Horde', 'Gordon_Cooper', 'Gottorfer_Riesenglobus', 'Graffiti', 'Griechische_Fußballnationalmannschaft', 'Grippe', 'Grosses_vollständiges_Universallexikon_aller_Wissenschaften_und_Künste', 'Große_Dhünntalsperre', 'Gunpowder_Plot', 'Göbekli_Tepe', 'Günter_Rinnhofer', 'Günther_Messner', 'Hammetschwand-Lift', 'Hanko_(Siegel)', 'Hannes_Kolehmainen', 'Hanns_Dieter_Hüsch', 'Hanns-Martin_Schleyer', 'Harald_Juhnke', 'Harlem_Renaissance', 'Harpo_Marx', 'Harry_Potter', 'Hartz-Konzept', 'Heavy-Metal-Umlaut', 'Heiliger_Gral', 'Helgoland', 'Helmarshausen', 'Helmut_Newton', 'Henry_Fielding', 'Heorhij_Kirpa', 'Heorhij_Mykolajowytsch_Kirpa', 'Hergé', 'Hermann_von_Reichenau', 'Hikikomori', 'Hirschziegenantilope', 'Hitzeschaden', 'Hochofen', 'Homosexualität_in_Japan', 'Hongkong', 'Hoodoo', 'Hornisse', 'Horst_Köhler', 'Horst_Seehofer', 'Horyu-ji', 'Howard_Hughes', 'Hugo_Chávez', 'Hurrikan_Katrina', 'IJsselmeer', 'ISS_Expedition_1', 'ISS_Expedition_2', 'Indonesien', 'Influenza', 'Inge_Meysel', 'Inka-Pfad', 'Inka', 'Internationale_Filmfestspiele_Berlin', 'Internationale_Raumstation', 'Inuit', 'Io_(Mond)', 'Ironbridge', 'Islamistendatei', 'J-Rock', 'Jacquerie', 'James_Bay', 'James_Clerk_Maxwell', 'James_Parkinson', 'Japanische_Fernsehserie', 'Jeremias_Gotthelf', 'Jerusalem', 'Joachim_Meisner', 'Joe_Davis', 'Johannes_Paul_II.', 'John_Kerry', 'John_Peel', 'Joshua_Norton', 'José_Manuel_Durão_Barroso', 'Jules_Verne', 'KZ_Auschwitz-Birkenau', 'KZ_Mauthausen', 'Kanon_des_Neuen_Testaments', 'Karl_Barth', 'Kemal_Atatürk', 'Kettcar_(Band)', 'Kettcar', 'Kilroy,_Kilroy_(Buch)', 'Kilroy', 'Kingidium', 'Klas_Pontus_Arnoldson', 'Komet', 'Kona-Sturm', 'Konföderationen-Pokal_2005', 'Konklave', 'Konrad_Zuse', 'Kotatsu', 'Krabbentaucher', 'Kreationismus', 'Krebsnebel', 'Kulturindustrie', 'Kunststoffgeldschein', 'Kurt_Schumacher', 'Kurt_Tucholsky', 'Kylemore_Abbey', 'Kyoto-Protokoll', 'Kängurus', 'LZ126', 'LaTeX', 'Landtagswahl_in_der_Steiermark_2005', 'Lastverteilung', 'Lautpoesie', 'Leh', 'Leuchtschnabelbeutelschabe', 'Lewis-und-Clark-Expedition', 'Libellen', 'Linux', 'Linz-Donawitz-Verfahren', 'Litchibaum', 'London_Underground', 'Londoner_Kutschenstreit', 'Ludwig_Scotty', 'Luftfeuchtigkeit', 'Lufthansa', 'Luftpumpe_(Sternbild)', 'Luxor-Tempel', 'MMORPG', 'Mac_mini', 'Mafalda_(Comicfigur)', 'Mahmud_Abbas', 'Mandelbrot-Menge', 'Mare_Imbrium', 'Maria_Scharapowa', 'Marie_Jahoda', 'Marija_Scharapowa', 'Marlon_Brando', 'Martin_Luther_King', 'Massaker_von_Nanking', 'Massive_Multiplayer_Online_Roleplaying_Game', 'Matsuo_Basho', 'Matthias_Platzeck', 'Max_Schmeling', 'Max_Strauß', 'Meerkatzenverwandte', 'Meerschweinchen', 'Meteorit', 'Methode_der_kleinsten_Quadrate', 'Metin_Kaplan', 'Metro_Budapest', 'Metro_Kairo', 'Michael_Ondaatje', 'Michael_Schumacher', 'Michelin-Männchen', 'Milch', 'Miles_Davis', 'Milgram-Experiment', 'Million_Dollar_Baby', 'Mittelland_(Schweiz)', 'Mittelsäger', 'Mittlerer_Sonnentau', 'Model_United_Nations', 'Moerser_Schloss', 'Mondtäuschung', 'Montpellier', 'Morgenländisches_Schisma', 'Morgestraich', 'Mosul', 'Mozilla_Firefox', 'Nachwahl', 'National_Museum_of_the_American_Indian', 'Nationaldemokratische_Partei_Deutschlands', 'Nationalpark_Kellerwald-Edersee', 'Natty_Dread', 'Neokolonialismus', 'Nepal', 'Nesselzelle', 'Newgate-Gefängnis', 'Nicolas_Sarkozy', 'Oktoberfest', 'Ol''_Dirty_Bastard', 'Onsen', 'Opinel', 'Oppidum_Milseburg', 'Option_in_Südtirol', 'Organspende', 'Osama_bin_Laden', 'Otl_Aicher', 'Owain_Glyndwr', 'PISA-Studie', 'PISA-Studien', 'Pachinko', 'Panspermie', 'Pantschen_Lama', 'Paracetamol', 'Paranal-Observatorium', 'Pariser_Kommune', 'Partikelfilter', 'Pascalsche_Wette', 'Pazifikkrieg', 'Peberholm', 'Pecherei', 'Per_Anhalter_durch_die_Galaxis', 'Petersilienkrieg', 'Petra_(Stadt)', 'Petros_VII.', 'Pferdebahn', 'Philipp_von_Hutten', 'Plattentektonik', 'Poetry_Slam', 'Polarstern_(Schiff)', 'Politisches_System_der_Türkei', 'Pontius_Pilatus', 'Pop-Art', 'Popkultur', 'Popliteratur', 'Popmusik', 'Prag', 'Priapswürmer', 'Print_on_demand', 'Prinzessin_Takamatsu', 'Präsidentschaftswahlen_in_der_Ukraine_2004', 'Puente_de_las_Américas', 'Pummerin', 'Quarkteich', 'Radio_Frequency_Identification', 'Radio_Vatikan', 'Ramones', 'Rauchverbot', 'Reichskrone', 'Reichstagsgebäude', 'René_Descartes', 'Respiratory_Syncytial_Virus', 'Rhön', 'Rinus_Michels', 'Roald_Dahl', 'Robert_Hoyzer', 'Robert_James_Fischer', 'Robert_Moog', 'Rock_of_Dunamase', 'Rocker', 'Roger_Federer', 'Ronaldinho', 'Ronda', 'Rosskastanie', 'Rosskastanien', 'Rowan_Atkinson', 'Roy_Lichtenstein', 'Rugby', 'Rundebrua', 'Rungholt', 'Russell_Jones', 'Ryokan', 'Römische_Bürgerkriege', 'Rösslitram', 'STS-114', 'Saddam_Hussein', 'Sake', 'San_Marino', 'Sandburg', 'Sandmännchen', 'Sankt_Petersburg', 'Sankt-Michaelskirche_Berlin', 'Sarja', 'Satyendra_Nath_Bose', 'Schaltsekunde', 'Schiedsrichter-Skandal_2005', 'Schmieden', 'Schnabeltier', 'Schokolade', 'Schwarzer_Holunder', 'Schwarzer_Tod', 'Schwebebahn_Dresden', 'Schweizerdeutsch', 'Sealand', 'Secondo', 'Segelfalter', 'Seifenblase', 'Seldschuken', 'Sendeanlagenabgabe', 'Siemens-Martin-Ofen', 'Silvester_I._(Papst)', 'Silvester_I.', 'Silvester', 'Simon_Wiesenthal', 'Skagerrakschlacht', 'Skellig_Michael', 'Snooker', 'Softwarepatente', 'Sommer-Paralympics_2004', 'Sonnenbrand', 'Sonnencreme', 'Soziales_Verhalten_in_Japan', 'SpaceShipOne', 'Spaceshuttle', 'Spannstahl', 'Spargel', 'Spex', 'Spätantike', 'Sri_Lanka', 'Stanley_Kubrick', 'Stephen_King', 'Stirling_Castle', 'Straße_von_Bonifacio', 'Studiengebühr', 'Städte_und_Landschaften_im_Oman', 'Super_Mario', 'Supraleiter', 'Surtsey', 'Susan_Sontag', 'Sushi', 'Swesda', 'Swetlana_Alexandrowna_Kusnezowa', 'Sylvester_und_Tweety', 'Sächsische_Postmeilensäule', 'Südostanatolien-Projekt', 'Südschleswigscher_Wählerverband', 'Tabakpfeife', 'Tabakspfeife', 'Tael', 'Taipei_101', 'Taklamakan', 'Tangram', 'Tara_(Ort)', 'Tee', 'Teebeutel', 'Terroranschläge_am_7._Juli_2005_in_London', 'Teufelsbrücke', 'The_Ganglords', 'The_Undertones', 'Thea_Rasche', 'Thelonious_Monk', 'Thomas_Klestil', 'Thomastag', 'Thunersee', 'Timofei_Wassiljewitsch_Prochorow', 'Timofej_Wasiljewitsch_Prochorow', 'Tobin-Steuer', 'Toiletten_in_Japan', 'Toll_Collect', 'Tour_de_France_2004', 'Tour_de_France', 'Trimethylborat', 'Tropheus', 'Tropischer_Wirbelsturm', 'Tsunami', 'Tundra', 'U-Bahn_Berlin', 'UN-Sicherheitsrat', 'US-Präsidentschaftswahlen_2004', 'Uhu_(Art)', 'Ulmer_Schachtel', 'Urban_legend', 'Urknall', 'Urmeter', 'Ursprünge_des_Hip_Hop', 'Urteil_des_Bundesverfassungsgerichts_zu_Neuwahlen_2005', 'Valentinstag', 'Vasco_da_Gama', 'Vassal_Gadoengin', 'Vertrag_über_eine_Verfassung_für_Europa', 'Vertrauensfrage_(Grundgesetz)', 'Very_Large_Array', 'Via_Claudia_Augusta', 'Visa-Affäre', 'Visual_Kei', 'Viterbi-Algorithmus', 'Vokaltrapez', 'Volmer-Erlass', 'Voyager_1', 'Wachau', 'Wahlsystem', 'Walchensee', 'Walnüsse', 'Warschauer_Straße_(Berlin)', 'Warwick_Castle', 'Wasser', 'Wasserbüffel', 'Weihnachten', 'Weinbau_in_Kanada', 'Weinbau', 'Weingesetz', 'Weinglas', 'Weisse_Rose', 'Weißes_Labkraut', 'Weißschnauzendelfin', 'Weltjugendtag_2005', 'Weltraumschrott', 'Weltsozialforum', 'Weltwirtschaftsforum', 'Wendehals_(Vogel)', 'Wendehals', 'Wetten_dass..?', 'Wiener_Kanalisation', 'Wiener_Wasserversorgung', 'Wikingerzeit_auf_den_Färöern', 'Wiktor_Janukowytsch', 'Wiktor_Juschtschenko', 'William_Westmoreland', 'Willy_Brandt', 'Wim_Duisenberg', 'Wimbledon_Championships', 'Wimper-Mannsschild', 'Wolke', 'Wurstkatastrophe', 'Wuxia', 'Würzburger_Stein', 'Yang-Stil_Taijiquan', 'Yassir_Arafat', 'Yasukuni', 'Yes_(Band)', 'Zahlensystem', 'Zauberformel', 'Zeit_der_Streitenden_Reiche', 'Zeugma_(Stadt)', 'Zoo_Zürich', 'Zottige_Wicke', 'Zugsicherungssystem', 'Zwergenmythos', 'en:David_Irving', 'Äquinoktium', 'ß'
) AND ( (cur_text LIKE '%[[Bild:%') OR (cur_text LIKE '%[[Image:%') ) AND ( (cur_text LIKE '%Literatur%') OR (cur_text LIKE '%Weblinks%') ) AND (cur_text NOT LIKE '%[[Kategorie:Jahrestag%') AND (cur_text NOT LIKE '%[[Kategorie: Jahrestag%') AND (cur_text NOT LIKE '%[[Kategorie:Jahr (20. Jh.)%') AND (cur_text NOT LIKE '%[[Kategorie: Jahr (20. Jh.)%') AND (cur_text NOT LIKE '%[[Kategorie:Ort in%') AND (cur_text NOT LIKE '%[[Kategorie: Ort in%') AND (cur_text NOT LIKE '%[[Kategorie:Ort im%') AND (cur_text NOT LIKE '%[[Kategorie: Ort im%') AND (cur_text NOT LIKE '%[[Kategorie:Ortsteil%') AND (cur_text NOT LIKE '%[[Kategorie: Ortsteil%') AND (cur_text NOT LIKE '%[[Kategorie:Stadtteil%') AND (cur_text NOT LIKE '%[[Kategorie: Stadtteil%') AND (cur_text NOT LIKE '%[[Kategorie:Liste%') AND (cur_text NOT LIKE '%[[Kategorie: Liste%') AND (cur_text NOT LIKE '%[[Kategorie:Bezirk%') AND (cur_text NOT LIKE '%[[Kategorie: Bezirk%') AND (cur_text NOT LIKE '%[[Kategorie:Regierungsbezirk%') AND (cur_text NOT LIKE '%[[Kategorie: Regierungsbezirk%') AND (cur_text NOT LIKE '%((stub))%') ORDER BY cur_random LIMIT 500;
Die Abfrage aus dem Dump vom 13. Juli 2005 zeigt derzeit die unten gezeigte Liste der ersten 500 Einträge. Derzeit findet die Abfrage 26290 mögliche Artikel, die ersten 500 sind hier gelistet.
Kommentare und Vorschläge dazu bitte auf der Diskussionsseite machen.
Das Ergebnis der Abfrage sollte hier zu finden sein:
Artikel, die "von von" enthalten (Stand: Dump vom Juli 2005), ausgenommen einige Artikel, die korrekterweise "von von" enthalten und Artikel, die 'davon von' oder 'hiervon von' enthalten:
SELECT concat('*[[',cur_title,']]','<br>'), concat( '<no','wiki>', SUBSTRING(cur_text,INSTR(cur_text,'von von')-40,40), '</no','wiki>', '\'\'\'von von\'\'\'', '<no','wiki>', SUBSTRING(cur_text,INSTR(cur_text,'von von')+7,40), '</no','wiki>', '<br>' ) FROM cur WHERE cur_namespace=0 AND cur_is_redirect=0 AND cur_text like '%von von%' AND cur_title not in ( 'Adjusted-Winner-Methode', 'Alexander_von_Falkenhausen', 'Alkippe', 'Andrew-Schnabelwal', 'Pinchas_Lavon', 'Phöbus', 'Paläontologisches_Museum_Nierstein', 'Opernhaus_Hannover', 'Friedrich_Leopold_zu_Stolberg-Stolberg', 'Dietmar_Munier', 'Bottrop', 'Bitmap', 'Geschichte_Israels', 'Hasso_von_Manteuffel', 'Hermann_von_Barth', 'Hofbieber', 'Jürgen_Aschoff', 'Karl_Leisner', 'Kurt_Vonnegut', 'Martin_Wilhelm_Kutta', 'Nürnberger_Prozess_gegen_die_Hauptkriegsverbrecher', 'Lucas_Jacobson_Debes', 'Kreatives_Milieu', 'Schlacht_bei_Charkow', 'Rhizopon', 'Reckahn', '6._Zusatz_zur_Verfassung_der_Vereinigten_Staaten_von_Amerika', 'American_Wrestling_Association', 'Aribert_Rothenberger', 'Palant', 'Burg_Vondern', 'Franz_von_Papen', 'John_Irving', 'Manderlay', 'Burg_Reisensburg', 'Mission_Erde', 'Paul_von_Hindenburg', 'Santiago_María_García_de_la_Rasilla_Domínguez', 'Karl_Alexander_von_Müller' ) AND cur_text not like '%davon von%' AND cur_text not like '%hiervon von%' AND cur_text not like '%von voneinander%'
Ergebnis:
SELECT concat('*[[',cur_title,']]','<br>'), concat( '<no','wiki>', SUBSTRING(cur_text,INSTR(cur_text,'Addresse')-40,40), '</no','wiki>', '\'\'\'', 'Addresse', '\'\'\'', '<no','wiki>', SUBSTRING(cur_text,INSTR(cur_text,'Addresse')+length('Addresse'),40), '</no','wiki>', '<br>' ) FROM cur WHERE cur_namespace=0 AND cur_is_redirect=0 AND cur_title not in ('Hallo-Welt-Programm') AND (cur_text like '%Addresse%' or cur_text like '%addresse%') AND cur_text not like '%Addresses%' AND cur_text not like '%Addressed%' AND cur_text not like '%addresses%' AND cur_text not like '%addressed%' AND cur_text not like '%Addresse ver gemeinschaft%';
Ergebnis siehe
alle erledigt
SELECT concat('*[[',cur_title,']]','<br>'), concat( '<no','wiki>', SUBSTRING(cur_text,INSTR(cur_text,'Agendas')-40,40), '</no','wiki>', '\'\'\'', 'Agendas', '\'\'\'', '<no','wiki>', SUBSTRING(cur_text,INSTR(cur_text,'Agendas')+length('Agendas'),40), '</no','wiki>', '<br>' ) FROM cur WHERE cur_namespace=0 AND cur_is_redirect=0 AND cur_title NOT IN ('Agenda_21') AND (cur_text like concat('%Agendas%') OR cur_text like concat('%agendas%')) AND cur_text NOT LIKE '%Agendasetting%' AND cur_text NOT LIKE '%Magendassel%' AND cur_text NOT LIKE '%magendassel%';
SELECT concat('*[[',cur_title,']]','<br>'), concat( '<no','wiki>', SUBSTRING(cur_text,INSTR(cur_text,'Alliert')-40,40), '</no','wiki>', '\'\'\'', 'Alliert', '\'\'\'', '<no','wiki>', SUBSTRING(cur_text,INSTR(cur_text,'Alliert')+7,40), '</no','wiki>', '<br>' ) FROM cur WHERE cur_namespace=0 AND cur_is_redirect=0 AND (cur_text like concat('%', 'alliert', '%') OR cur_text like concat('%', 'Alliert', '%')) AND cur_text not like '%installiert%' AND cur_text not like '%kristalliert%' AND cur_text not like '%falliert%' AND cur_text not like '%metalliert%' ;
Ergebnisse
SELECT concat('*[[',cur_title,']]','<br>'), concat( '<no','wiki>', SUBSTRING(cur_text,INSTR(cur_text,'Bei')-40,40), '</no','wiki>', '\'\'\'', 'Bei', '\'\'\'', '<no','wiki>', SUBSTRING(cur_text,INSTR(cur_text,'Bei')+'Bei',40), '</no','wiki>', '<br>' ) FROM cur WHERE cur_namespace=0 AND cur_is_redirect=0 AND cur_title not in ('Tippfehler') AND (cur_text like '%Beipiel%' OR cur_text like '%Beispei%' OR cur_text like '%beipiel%' OR cur_text like '%beispei%') ;
alle erledigt
Die ersten 200 Artikel, die genau einen Brokenlink haben.
SELECT concat('*[[',c1.cur_title,']]',' [[',p.pl_title,']]<br>'), COUNT(*) FROM pagelinks p, cur c1 WHERE c1.cur_namespace = 0 AND c1.cur_is_redirect = 0 AND c1.cur_id = p.pl_from AND c1.cur_title like 'Ac%' AND NOT EXISTS ( SELECT * FROM cur c2 WHERE c2.cur_namespace = p.pl_namespace AND c2.cur_title = p.pl_title ) GROUP BY p.pl_from HAVING COUNT(*) = 1 LIMIT 200;
Diese Abfrage ist ein erster Versuch, um kompliziertere Abfragen zu bauen.
SELECT c1.cur_namespace, c1.cur_title, c1.cur_id, c2.cur_id, c2.cur_title FROM links l, cur c1, cur c2 WHERE l.l_from = c1.cur_id AND l.l_to = c2.cur_id AND c1.cur_namespace = 0 AND c1.cur_is_redirect = 0 AND c1.cur_text like '%[[' || c2.cur_title || '|%' LIMIT 100
SELECT c1.cur_namespace, c1.cur_title, c1.cur_id, c2.cur_namespace, c2.cur_title, c2.cur_id FROM links l, cur c1, cur c2 WHERE l.l_from = c1.cur_id AND c1.cur_namespace = 0 AND c1.cur_is_redirect = 0 AND l.l_to = c2.cur_id AND c1.cur_text like '%[[' || c2.cur_title || '|%' LIMIT 100
SELECT c1.cur_namespace, c1.cur_title, c1.cur_id, c2.cur_namespace, c2.cur_title, c2.cur_id FROM cur c1, cur c2 WHERE c1.cur_namespace = 0 AND c1.cur_is_redirect = 0 AND c1.cur_text like concat('%[[',c2.cur_title,'|%') LIMIT 200
SELECT cur_namespace, cur_title, cur_timestamp FROM cur WHERE cur_namespace = 0 AND cur_is_redirect = 0 AND (cur_text like '%ae%' OR cur_text like '%AE%') AND cur_title NOT IN ('AEIOU','1467') AND cur_text NOT LIKE ('%Michael%') AND cur_text NOT LIKE ('%Ismael%') AND cur_text NOT LIKE ('%israel%') AND cur_text NOT LIKE ('%Israel%') AND cur_text NOT LIKE ('%Aemilianus%') AND cur_text NOT LIKE ('%Raffael%') AND cur_text NOT LIKE ('%Nathanael%') AND cur_text NOT LIKE ('%Raphael%') AND cur_text NOT LIKE ('%Aero%') AND cur_text NOT LIKE ('%SHAEF%') AND cur_text NOT LIKE ('%Caesar%') AND cur_text NOT LIKE ('%Maestoso%') AND cur_text NOT LIKE ('%maestoso%') AND cur_text NOT LIKE ('%Nicolae%') AND cur_text NOT LIKE ('%Naevius%') AND cur_text NOT LIKE ('%Aegidius%') AND cur_text not like '%Kim Dae Jung%' LIMIT 200
SELECT cur_namespace, cur_title, cur_timestamp FROM cur WHERE cur_namespace = 0 AND cur_is_redirect = 0 AND (cur_text like '%oe%' OR cur_text like '%OE%') AND cur_title NOT IN ('AEIOU','1467') LIMIT 200
SELECT cur_namespace, cur_title, cur_timestamp FROM cur WHERE cur_namespace = 0 AND cur_is_redirect = 0 AND (cur_text like '%ue%' OR cur_text like '%UE%') AND cur_title NOT IN ('AEIOU','1467') AND cur_text NOT LIKE '%Frauen%' AND cur_text NOT LIKE '%Samuel%' AND cur_text NOT LIKE '%aktuell%' AND cur_text NOT LIKE '%dauer%' AND cur_text NOT LIKE '%Dauer%' AND cur_text NOT LIKE '%Schauen%' AND cur_text NOT LIKE '%schauen%' AND cur_text NOT LIKE '%Bauer%' AND cur_text NOT LIKE '%bauer%' AND cur_text NOT LIKE '%true%' AND cur_text NOT LIKE '%Quell%' AND cur_text NOT LIKE '%Blue%' AND cur_text NOT LIKE '%konsequent%' AND cur_text NOT LIKE '%neue%' AND cur_text NOT LIKE '%sexuell%' AND cur_text NOT LIKE '%zuerst%' AND cur_text NOT LIKE '%Aue%' AND cur_text NOT LIKE '%Donaueschingen%' LIMIT 200
SELECT cur_namespace, cur_title, cur_timestamp FROM cur WHERE cur_namespace = 0 AND cur_is_redirect = 0 AND cur_title not in ('August_Hinrichs', 'Grimms_Märchen', 'OutKast', 'Fishbone', 'Bro_gozh_ma_zadoù', 'Christina_Milian', 'Hermann_Claudius', 'Liste_von_Märchen', 'Monica_Arnold', 'Niederlausitzer_Eisenbahn-Gesellschaft', 'The_Diary_of_Alicia_Keys') AND cur_text like '% dre %' AND cur_text not like '%dr. dre%' AND cur_text not like '%Dr Dre%' LIMIT 200
alle erledigt
Die folgende Abfrage versucht, Verlinkungen anzuzeigen, bei denen der Anzeigetext gleich dem Link ist
SELECT c.cur_namespace, c.cur_title FROM cur c WHERE c.cur_namespace = 0 AND c.cur_is_redirect = 0 AND EXISTS ( SELECT * FROM pagelinks p WHERE c.cur_id = p.pl_from AND c.cur_text like concat('%[[', p.pl_to, '|', p.pl_to, ']]%') ) LIMIT 200
Die folgende Abfrage versucht, Verlinkungen anzuzeigen, bei denen der Anzeigetext auch als Link verfügbar ist
SELECT c.cur_namespace, c.cur_title FROM cur c WHERE c.cur_namespace = 0 AND c.cur_redirect = 0 AND EXISTS ( SELECT * FROM pagelinks p, cur c2 WHERE c.cur_id = p.pl_from AND c.cur_text like concat('%[[', p.pl_to, '|', c2.cur_title, ']]%') ) LIMIT 200
Alle Links im Artikel 'Österreich'
SELECT p.pl_namespace, p.pl_title FROM pagelinks p, cur c1 WHERE c1.cur_namespace = 0 AND c1.cur_is_redirect = 0 AND c1.cur_id = p.pl_from AND c1.cur_title like 'Österreich' LIMIT 200;
Alle Brokenlinks im Artikel 'Österreich'
SELECT p.pl_namespace, p.pl_title FROM pagelinks p, cur c1 WHERE c1.cur_namespace = 0 AND c1.cur_is_redirect = 0 AND c1.cur_id = p.pl_from AND c1.cur_title like 'Österreich' AND NOT EXISTS ( SELECT * FROM cur c2 WHERE c2.cur_namespace = p.pl_namespace AND c2.cur_title = p.pl_title ) LIMIT 200;
Alle vorhandenn Links im Artikel 'Österreich'
SELECT p.pl_namespace, p.pl_title FROM pagelinks p, cur c1 WHERE c1.cur_namespace = 0 AND c1.cur_is_redirect = 0 AND c1.cur_id = p.pl_from AND c1.cur_title like 'Österreich' AND EXISTS ( SELECT * FROM cur c2 WHERE c2.cur_namespace = p.pl_namespace AND c2.cur_title = p.pl_title ) LIMIT 200;
Eine Abfrage, die unnütze Linktexte findet, also Dinge wie [[text|text]]
nicht fertig!
SELECT c.cur_namespace, c.cur_title FROM cur c WHERE c.cur_namespace = 0 AND c.cur_redirect = 0 AND c.cur_text like '%%%' AND substring AND EXISTS ( SELECT * FROM CUR c2 WHERE ) LIMIT 100
Die dreißig meistbesuchten Seiten. ACHTUNG: Diese Daten werden in der Tabelle cur anscheinend nicht mehr upgedated!
select cur_title, cur_counter from cur order by cur_counter desc limit 30;
Sucht alle Artikel, die "SELECT" und "FROM" enthalten.
select cur_namespace,cur_title from cur where cur_title not like '%.css' and not (cur_namespace = 4 and (cur_title like 'Archiv:L%sch-Logbuch%' or cur_title like 'Archiv:Datei-Logbuch/%')) and upper(cur_text) like '%SELECT%FROM%';
Ergebnis:
Leider sind bei wikisign die Benutzer-Seiten nicht enthalten, deshalb ist das Ergebnis nicht sehr nützlich...
siehe auch Benutzer:SirJective/Wartungslisten/Kürzere_Treffer
SELECT DISTINCT CONCAT('* [[Spezial:Whatlinkshere/',p.pl_title,'|',p.pl_title,']] -> [[',cto.cur_title,']]') AS data FROM pagelinks p, cur AS cto, cur AS cfrom WHERE cto.cur_namespace = 0 AND cfrom.cur_namespace = 0 and cfrom.cur_id = p.pl_from AND NOT EXISTS ( SELECT * FROM cur c WHERE c.cur_namespace = p.pl_namespace AND c.cur_title = p.pl_title ) AND LENGTH(p.pl_title)>=4 AND p.pl_title REGEXP '[a-z]' AND cto.cur_title = SUBSTRING(p.pl_title, 1, LENGTH(p.pl_title)-1) ORDER BY SUBSTRING(p.pl_title, LENGTH(p.pl_title),1), p.pl_title;
SELECT substring_index(substring_index(cur_title, ')', 1), '(', -1) as Homonymzusatz, count(substring_index(substring_index(cur_title, ')', 1), '(', -1)) as Anzahl, cur_title as Titel FROM cur WHERE cur_title rlike '.+\\(.+\\)*' AND cur_namespace=0 GROUP BY Homonymzusatz ORDER BY Homonymzusatz;