Ich verwende inzwischen für fast alle Abfragen entweder das Datenbank-Abfrage-Tool unter http://wikisign.org/ oder meine Titel-Suche under http://dstadler.org/grepwikititle.php

Viele andere Seiten mit Abfragen sind hier gelistet: Benutzer:SirJective/Seiten_mit_Datenbank-Abfragen

Bitte gewünschte Anfragen auf dieser Seite stellen.

Grep auf all_titles_ns0.gz

[Bearbeiten | Quelltext bearbeiten]

siehe http://dstadler.org/grepwikititle.php

Schnelllöschung:

 ((Löschen)) ''Falsches Lemma, keine Verweise mehr auf diesen Artikel'' --~~~~
 ----
 

Datenbank

[Bearbeiten | Quelltext bearbeiten]

ToDo

[Bearbeiten | Quelltext bearbeiten]
[Bearbeiten | Quelltext bearbeiten]

Selektiere die Anzahl der Sätze aus pagelinks bei denen der Ziel-Artikel nicht vorhanden ist, gruppiert nach Namespace.

 SELECT p.pl_namespace, COUNT(*) AS Anzahl, "<br/>"
 FROM pagelinks p, cur c1
 WHERE NOT EXISTS ( 
       SELECT * 
       FROM cur c 
       WHERE c.cur_namespace = p.pl_namespace AND c.cur_title = p.pl_title )
 GROUP BY p.pl_namespace
 ORDER BY Anzahl DESC
 LIMIT 500

Ergenibs:

[Bearbeiten | Quelltext bearbeiten]

Selektiere Sätze aus pagelinks bei denen der Ziel-Artikel nicht vorhanden ist und ein bestimmtes Sonderzeichen im Titel vorkommt.

 SELECT
 CONCAT('[http://de.wikipedia.org/w/index.php?title=Spezial:Whatlinkshere&target=',
 replace(replace(replace(p.pl_title,"'","%27"),'"','%22'),'\\','%5C'),
 ' ', p.pl_title,'] ') AS Artikel,
 COUNT(p.pl_title) AS Anzahl,
 "<br/>"
 FROM pagelinks p, cur c1
 WHERE (p.pl_title LIKE '%!%' OR p.pl_title LIKE '%&%' OR p.pl_title LIKE '%*%' OR p.pl_title LIKE '%$%'
  OR p.pl_title LIKE '%@%' OR p.pl_title LIKE '%#%' OR p.pl_title LIKE '%^%' OR p.pl_title LIKE '%+%'
  OR p.pl_title LIKE '%=%' OR p.pl_title LIKE '%:%' OR p.pl_title LIKE '%;%'
  OR p.pl_title LIKE '%,%' OR p.pl_title LIKE '%\%' OR p.pl_title LIKE '%?%'
  OR p.pl_title LIKE '%<%' OR p.pl_title LIKE '%>%' OR p.pl_title LIKE '%|%'
  OR p.pl_title LIKE '%[%' OR p.pl_title LIKE '%]%' OR p.pl_title LIKE '%{%' OR p.pl_title LIKE '%}%')
 AND c1.cur_id = p.pl_from
 AND c1.cur_is_redirect = 0
 AND c1.cur_namespace = 0
 AND NOT EXISTS ( 
       SELECT * 
       FROM cur c 
       WHERE c.cur_namespace = p.pl_namespace AND c.cur_title = p.pl_title )
 GROUP BY p.pl_title
 ORDER BY Anzahl DESC, p.pl_title ASC
 LIMIT 500

Ergebnis:

Nicht vorhandene Artikel mit Sonderzeichen am Anfang

[Bearbeiten | Quelltext bearbeiten]

Ähnlich wie Benutzer:Bananeweizen/Nicht_vorhandene_Artikel_mit_Sonderzeichen_am_Anfang, jedoch an neue Tabellenstruktur angepasst.

Selektiere alle Sätze aus pagelinks bei denen der Ziel-Artikel nicht vorhanden ist und gruppiere sie nach Titel.

 SELECT
 CONCAT('[http://de.wikipedia.org/w/index.php?title=Spezial:Whatlinkshere&target=',
 replace(replace(replace(p.pl_title,"'","%27"),'"','%22'),'\\','%5C'),
 ' ', p.pl_title,'] ') AS Artikel,
 COUNT(p.pl_title) AS Anzahl,
 "<br/>"
 FROM pagelinks p, cur c1
 WHERE p.pl_title NOT REGEXP '^[[:alnum:]]'
 AND p.pl_title NOT IN ('!Kung', '(Artificial_Intelligence)', '?uestlove', '*BEN*', '!anda!', '!Kwi', '@Large',
    '(A)live In Concert 97', '(Best LIVE) (James Taylor)', '(LIVE) (James Taylor)', '(The Death Of) Anna Karina',
    '(Welcome To) Sky Valley')
 AND c1.cur_id = p.pl_from
 AND c1.cur_is_redirect = 0
 AND c1.cur_namespace = 0
 AND c1.cur_title NOT IN ('Liste_historischer_Flugzeugträger')
 AND NOT EXISTS ( 
       SELECT * 
       FROM cur c 
       WHERE c.cur_namespace = p.pl_namespace AND c.cur_title = p.pl_title )
 GROUP BY p.pl_title
 ORDER BY Anzahl DESC, p.pl_title ASC
 LIMIT 500

Das Ergebnis dieser Abfrage ist hier verfügbar:

alle überprüft...

Thaeter

[Bearbeiten | Quelltext bearbeiten]
SELECT cur_namespace, cur_title, cur_timestamp 
FROM cur 
WHERE cur_title not in ('Gustav König') 
AND cur_text like '%Thaeter%'
LIMIT 100

alle erledigt

DOT-Diagram

[Bearbeiten | Quelltext bearbeiten]

Selektiert Daten in einem Format das mit DOT (http://www.graphviz.org/) zu einer netten Graphik verarbeitet werden kann.

[Bearbeiten | Quelltext bearbeiten]
SELECT DISTINCT concat('"',c1.cur_title,'"->"',c2.cur_title,'"')
FROM cur c1, cur c2, links l
WHERE c1.cur_id = l.l_from
AND c1.cur_namespace = 0
AND c1.cur_is_redirect = 0
AND c2.cur_id = l.l_to
AND c1.cur_title = 'Oberkappel'
LIMIT 500
[Bearbeiten | Quelltext bearbeiten]
SELECT DISTINCT concat('"',c1.cur_title,'"->"',c2.cur_title,'"')
FROM cur c0, links l0, links l, cur c1, cur c2
WHERE c0.cur_title = 'Oberkappel'
AND c0.cur_namespace = 0
AND c0.cur_is_redirect = 0
AND c0.cur_id = l0.l_from
AND l0.l_to = l.l_from
AND c1.cur_id = l.l_from
AND c2.cur_id = l.l_to
LIMIT 500
[Bearbeiten | Quelltext bearbeiten]
SELECT DISTINCT concat('"',c1.cur_title,'"->"',b.bl_to,'"')
FROM cur c1, brokenlinks b
WHERE c1.cur_id = b.bl_to
AND c1.cur_namespace = 0
AND c1.cur_is_redirect = 0
AND c1.cur_title = 'Oberkappel'
LIMIT 500

Viele "Brokenlinks"

[Bearbeiten | Quelltext bearbeiten]

Artikel, die besonders viele "Brokenlinks" aufweisen, ausgenommen Artikel, die in einer Kategorie "Liste..." oder "Ort..." aufscheinen. Das Ergebnis zeigt einerseits Artikel, die in eine der Listen-Kategorien aufgenommen werden sollten und andererseits, welche normalen Artikel sehr viele Links auf nicht-vorhandene Artikel enthalten. Diese Artikel sind potentielle Artikel für ein Review, um herauszufinden, warum soviele fehlende Links enthalten sind.

SELECT concat('*[[',c1.cur_title,']]','<br>'), COUNT(*)
SELECT c1.cur_namespace, c1.cur_title, count(*)
FROM pagelinks p, cur c1
WHERE c1.cur_namespace = 0
AND c1.cur_is_redirect = 0
AND c1.cur_id = p.pl_from
AND c1.cur_text NOT LIKE '%[[Kategorie:Liste%' 
AND c1.cur_text NOT LIKE '%[[Kategorie: Liste%' 
AND c1.cur_text NOT LIKE '%[[Kategorie:Teilliste%' 
AND c1.cur_text NOT LIKE '%[[Kategorie: Teilliste%' 
AND c1.cur_text NOT LIKE '%[[Kategorie:Ort%' 
AND c1.cur_text NOT LIKE '%[[Kategorie: Ort%' 
AND c1.cur_text NOT LIKE '%[[Kategorie:Kommunen%' 
AND c1.cur_text NOT LIKE '%[[Kategorie: Kommunen%' 
AND c1.cur_text NOT LIKE '%[[Kategorie:Themenliste%' 
AND c1.cur_text NOT LIKE '%[[Kategorie: Themenliste%'
AND c1.cur_text NOT LIKE '%((Navigationsleiste Liste%'
AND NOT EXISTS ( 
 SELECT * FROM cur c2 WHERE c2.cur_namespace = p.pl_namespace AND c2.cur_title = p.pl_title )
GROUP BY p.pl_from
ORDER BY 3 DESC
LIMIT 100

Ergebnise:

Kandidaten für den WikiReader Digest

[Bearbeiten | Quelltext bearbeiten]

Das folgende SQL-Select ermittelt Kandidaten für den WikiReader Digest nach den vorgeschlagenen Kriterien.

$ARTIKEL wird durch ein kleines Script auf die Artikel aus der Liste unter Wikipedia:Archiv/WikiReader Digest/Artikelliste gesetzt und dadurch Artikel, die bereits in Readern vorgekommen sind, von der Auswahl ausgenommen. Außerdem wird die Artikelliste auf Redirekts überprüft und diese Artikel auch ausgeschlossen. Weiters werden Jahrestage und einige Artikel zu Jahren ausgenommen, weitere solche Kriterien können jederzeit aufgenommen werden.


select concat('*[[',cur_title,']]')
select cur_namespace, cur_title
select count(*)
from cur
where cur_is_redirect = 0
     AND cur_namespace = 0
     AND LENGTH(cur_text) > 2000
     AND cur_title NOT LIKE 'Portal:%'
     AND cur_title not in ( 

'1984_(Roman)', '2002_AA29', '3D-Foto', '42_(Antwort)', 'AIDS', 'Aarau', 'Abraham_Lincoln', 'Absarokee', 'Absatzlogistik', 'Acadia-Nationalpark', 'Aceh', 'Ada_(Programmiersprache)', 'Adam_Opel_AG', 'Adrian_Nastase', 'Afrikanische_Union', 'Afrikanischer_Wildhund', 'Airbus_A380', 'Al_Capone', 'Alan_Cox', 'Albert_Einstein', 'Albert_Pierrepoint', 'Albulabahn', 'Allgemeine_Relativitätstheorie', 'Alter_Jüdischer_Friedhof_an_der_Oberstraße', 'Anarchismus', 'Andy_Warhol', 'Angela_Merkel', 'Angriff_auf_Pearl_Harbor', 'Anne_Frank', 'Anonymität_im_Internet', 'Ansari_X-Prize', 'Antarktis', 'Apallisches_Syndrom', 'Apple_iPod', 'Argentinien-Krise', 'Arschbombe', 'Arthur_Rimbaud', 'Asiento', 'Atlantropa', 'Atombombenexplosion', 'Aufstand_der_Vendée', 'Augusta_von_Sachsen-Weimar-Eisenach', 'Augustinus_von_Hippo', 'Australian_Football_in_Nauru', 'Badekarre', 'Bahn_2000', 'Baikal-Amur-Magistrale', 'Baikalsee', 'Balkankonflikt', 'Banff-Nationalpark', 'Barrique', 'Bauhaus_Dessau', 'Bebop', 'Belagerung_von_Konstantinopel_(717–718)', 'Benedikt_XVI.', 'Benjamin_von_Stuckrad-Barre', 'Benoît_Mandelbrot', 'Berchtesgadener_Alpen', 'Bergpark_Wilhelmshöhe', 'Berlinale', 'Bermudadreieck', 'Bernhard_zur_Lippe-Biesterfeld', 'Bernstein', 'Besetzung_der_Hainburger_Au', 'Bier', 'Bilderrätsel', 'Biogas', 'Bleistift', 'Blue_Note_Records', 'Blue_Note', 'Borderline-Persönlichkeitsstörung', 'Brandmelder', 'Braunbär', 'Bretagne', 'Briançon', 'Britische_Ostindien-Kompanie', 'Brunegggletscher', 'Brunnen_(Motiv)', 'Bryce-Canyon-Nationalpark', 'Bud_Powell', 'Budapester_Thermalbäder', 'Bundestagswahl_2005', 'Bundesverfassungsgericht', 'Bundeswehr', 'Burren', 'Bülbüls', 'Calanda_(Berg)', 'Camera_obscura', 'Canadarm2', 'Canadian_Pacific_Railway', 'Cangaçeiro', 'Cape-Roberts-Bohrprojekt', 'Capsaicin', 'Carl_van_Vechten',_-_wurde_erweitert 'Cassini-Huygens', 'CeBIT', 'Charles_Manson', 'Charlie_Parker', 'Chemins_de_fer_de_la_Corse', 'Chesapeake_Bay', 'Chinas_Grüne_Mauer', 'Cholerabrunnen', 'Chop', 'Chorleitung', 'Christopher_Reeve', 'Christopher_Street_Day', 'Chuchichäschtli', 'Châteauneuf-du-Pape', 'Cliffs_of_Moher', 'Cochleaimplantat', 'Columbus_Raumlabor', 'Competitive_Intelligence', 'Connemara_Nationalpark', 'Connemara', 'Croagh_Patrick', 'Cupola', 'Côte_d''Ivoire', 'DVB-T', 'Dachgaube', 'Daguerreotypie', 'Damaszener_Stahl', 'Daniel_Boone', 'Darfur', 'Dayton-Vertrag', 'Deep_Thought', 'Depression', 'Der_Spiegel', 'Desoxyribonukleinsäure', 'Destiny_(ISS)', 'Deutsche_Lufthansa', 'Deutsche_Sprache_in_den_USA', 'Deutschschweizer_Gebärdensprache', 'Dhimmi', 'Didgeridoo', 'Die_Aktion', 'Die_Gesellschaft_des_Spektakels', 'Die_Welle', 'Dietrich_Bonhoeffer', 'Digital_Rights_Management', 'Diglossie', 'Dinner_for_One', 'Dizzy_Gillespie', 'Doppelbrechung', 'Doppler-Effekt', 'Dorama', 'Dorothea_Viehmann', 'Dostojewski', 'Douglas_Adams', 'Dresden', 'Dwight_Yorke', 'Dynastie_der_Saud', 'Déjà-vu-Erlebnis', 'EU-Kommission', 'Edvard_Munch', 'Eilean_Donan_Castle', 'Eintrittskarten_Fußball-Weltmeisterschaft_2006', 'Eisenerz', 'Eisenhutblättriger_Hahnenfuß', 'El_Niño', 'Electric_Tablet_System', 'Elfriede_Jelinek', 'Eliot_Ness', 'Elvis_Presley', 'Eminem', 'Enchiridion_Helveticum_Constantiae_Episcopalis', 'Engrish', 'Ephraim_Kishon', 'Erdbeben_im_Indischen_Ozean_2004', 'Erdbeben', 'Erfundenes_Mittelalter', 'Eric_Clapton', 'Erkältung', 'Erneuerbare_Energie', 'Erwin_Teufel', 'Esperanto-Literatur', 'Euro', 'Europäischer_Haftbefehl', 'Fahd_ibn_Abd_al-Aziz', 'Fanzine', 'Fastenzeit', 'Feinstaub', 'Felix_the_Cat', 'Felsenbad_Pottenstein', 'Fettmilch-Aufstand', 'Filmempfindlichkeit', 'Finnisches_Bildungssystem', 'First_Nations_University_of_Canada', 'Fish_and_Chips', 'Fjodor_Michailowitsch_Dostojewski', 'Flaggenstreit_zwischen_den_USA_und_Panama_1964', 'Flatted_fifth', 'Foo', 'Framework', 'Frankfurt_am_Main', 'Franklin_Pierce', 'Französische_Revolution', 'Frauenfeld', 'Frauenkirche_(Dresden)', 'Frauenwaggon', 'Freiheitsstatue', 'Freikörperkultur', 'Freimaurerei', 'Friedhof_der_Märzgefallenen', 'Friedrich_Schiller', 'Fruchtbringende_Gesellschaft', 'Frère_Roger', 'Frédéric_Auguste_Bartholdi', 'Frühsommer-Meningoenzephalitis', 'Frühstücksei', 'Fußball-Europameisterschaft_2004', 'Fußballeuropameisterschaft_2004', 'Fußballkrieg', 'Fußballnationalmannschaft_von_Trinidad_und_Tobago', 'Fête_des_Vignerons', 'Galileo_Galilei', 'Galveston-Hurrikan_(1900)', 'Gangesgavial', 'Gaza-Streifen', 'Gazastreifen', 'Gefangenenbibliothek', 'Gefleckter_Aronstab', 'Geflügelpest', 'Gemini_3', 'Geocaching', 'Georg_Milbradt', 'George_W._Bush', 'Gerhard_Schröder', 'Germanische_Mythologie', 'Geschichte_Monacos', 'Geschichte_der_Eisenbahn', 'Geschichte_der_Lufthansa', 'Geschichte_der_Stadt_Nürnberg', 'Geschichte_des_Libanon', 'Glaukom', 'Godwins_Gesetz', 'Goldene_Horde', 'Gordon_Cooper', 'Gottorfer_Riesenglobus', 'Graffiti', 'Griechische_Fußballnationalmannschaft', 'Grippe', 'Grosses_vollständiges_Universallexikon_aller_Wissenschaften_und_Künste', 'Große_Dhünntalsperre', 'Gunpowder_Plot', 'Göbekli_Tepe', 'Günter_Rinnhofer', 'Günther_Messner', 'Hammetschwand-Lift', 'Hanko_(Siegel)', 'Hannes_Kolehmainen', 'Hanns_Dieter_Hüsch', 'Hanns-Martin_Schleyer', 'Harald_Juhnke', 'Harlem_Renaissance', 'Harpo_Marx', 'Harry_Potter', 'Hartz-Konzept', 'Heavy-Metal-Umlaut', 'Heiliger_Gral', 'Helgoland', 'Helmarshausen', 'Helmut_Newton', 'Henry_Fielding', 'Heorhij_Kirpa', 'Heorhij_Mykolajowytsch_Kirpa', 'Hergé', 'Hermann_von_Reichenau', 'Hikikomori', 'Hirschziegenantilope', 'Hitzeschaden', 'Hochofen', 'Homosexualität_in_Japan', 'Hongkong', 'Hoodoo', 'Hornisse', 'Horst_Köhler', 'Horst_Seehofer', 'Horyu-ji', 'Howard_Hughes', 'Hugo_Chávez', 'Hurrikan_Katrina', 'IJsselmeer', 'ISS_Expedition_1', 'ISS_Expedition_2', 'Indonesien', 'Influenza', 'Inge_Meysel', 'Inka-Pfad', 'Inka', 'Internationale_Filmfestspiele_Berlin', 'Internationale_Raumstation', 'Inuit', 'Io_(Mond)', 'Ironbridge', 'Islamistendatei', 'J-Rock', 'Jacquerie', 'James_Bay', 'James_Clerk_Maxwell', 'James_Parkinson', 'Japanische_Fernsehserie', 'Jeremias_Gotthelf', 'Jerusalem', 'Joachim_Meisner', 'Joe_Davis', 'Johannes_Paul_II.', 'John_Kerry', 'John_Peel', 'Joshua_Norton', 'José_Manuel_Durão_Barroso', 'Jules_Verne', 'KZ_Auschwitz-Birkenau', 'KZ_Mauthausen', 'Kanon_des_Neuen_Testaments', 'Karl_Barth', 'Kemal_Atatürk', 'Kettcar_(Band)', 'Kettcar', 'Kilroy,_Kilroy_(Buch)', 'Kilroy', 'Kingidium', 'Klas_Pontus_Arnoldson', 'Komet', 'Kona-Sturm', 'Konföderationen-Pokal_2005', 'Konklave', 'Konrad_Zuse', 'Kotatsu', 'Krabbentaucher', 'Kreationismus', 'Krebsnebel', 'Kulturindustrie', 'Kunststoffgeldschein', 'Kurt_Schumacher', 'Kurt_Tucholsky', 'Kylemore_Abbey', 'Kyoto-Protokoll', 'Kängurus', 'LZ126', 'LaTeX', 'Landtagswahl_in_der_Steiermark_2005', 'Lastverteilung', 'Lautpoesie', 'Leh', 'Leuchtschnabelbeutelschabe', 'Lewis-und-Clark-Expedition', 'Libellen', 'Linux', 'Linz-Donawitz-Verfahren', 'Litchibaum', 'London_Underground', 'Londoner_Kutschenstreit', 'Ludwig_Scotty', 'Luftfeuchtigkeit', 'Lufthansa', 'Luftpumpe_(Sternbild)', 'Luxor-Tempel', 'MMORPG', 'Mac_mini', 'Mafalda_(Comicfigur)', 'Mahmud_Abbas', 'Mandelbrot-Menge', 'Mare_Imbrium', 'Maria_Scharapowa', 'Marie_Jahoda', 'Marija_Scharapowa', 'Marlon_Brando', 'Martin_Luther_King', 'Massaker_von_Nanking', 'Massive_Multiplayer_Online_Roleplaying_Game', 'Matsuo_Basho', 'Matthias_Platzeck', 'Max_Schmeling', 'Max_Strauß', 'Meerkatzenverwandte', 'Meerschweinchen', 'Meteorit', 'Methode_der_kleinsten_Quadrate', 'Metin_Kaplan', 'Metro_Budapest', 'Metro_Kairo', 'Michael_Ondaatje', 'Michael_Schumacher', 'Michelin-Männchen', 'Milch', 'Miles_Davis', 'Milgram-Experiment', 'Million_Dollar_Baby', 'Mittelland_(Schweiz)', 'Mittelsäger', 'Mittlerer_Sonnentau', 'Model_United_Nations', 'Moerser_Schloss', 'Mondtäuschung', 'Montpellier', 'Morgenländisches_Schisma', 'Morgestraich', 'Mosul', 'Mozilla_Firefox', 'Nachwahl', 'National_Museum_of_the_American_Indian', 'Nationaldemokratische_Partei_Deutschlands', 'Nationalpark_Kellerwald-Edersee', 'Natty_Dread', 'Neokolonialismus', 'Nepal', 'Nesselzelle', 'Newgate-Gefängnis', 'Nicolas_Sarkozy', 'Oktoberfest', 'Ol''_Dirty_Bastard', 'Onsen', 'Opinel', 'Oppidum_Milseburg', 'Option_in_Südtirol', 'Organspende', 'Osama_bin_Laden', 'Otl_Aicher', 'Owain_Glyndwr', 'PISA-Studie', 'PISA-Studien', 'Pachinko', 'Panspermie', 'Pantschen_Lama', 'Paracetamol', 'Paranal-Observatorium', 'Pariser_Kommune', 'Partikelfilter', 'Pascalsche_Wette', 'Pazifikkrieg', 'Peberholm', 'Pecherei', 'Per_Anhalter_durch_die_Galaxis', 'Petersilienkrieg', 'Petra_(Stadt)', 'Petros_VII.', 'Pferdebahn', 'Philipp_von_Hutten', 'Plattentektonik', 'Poetry_Slam', 'Polarstern_(Schiff)', 'Politisches_System_der_Türkei', 'Pontius_Pilatus', 'Pop-Art', 'Popkultur', 'Popliteratur', 'Popmusik', 'Prag', 'Priapswürmer', 'Print_on_demand', 'Prinzessin_Takamatsu', 'Präsidentschaftswahlen_in_der_Ukraine_2004', 'Puente_de_las_Américas', 'Pummerin', 'Quarkteich', 'Radio_Frequency_Identification', 'Radio_Vatikan', 'Ramones', 'Rauchverbot', 'Reichskrone', 'Reichstagsgebäude', 'René_Descartes', 'Respiratory_Syncytial_Virus', 'Rhön', 'Rinus_Michels', 'Roald_Dahl', 'Robert_Hoyzer', 'Robert_James_Fischer', 'Robert_Moog', 'Rock_of_Dunamase', 'Rocker', 'Roger_Federer', 'Ronaldinho', 'Ronda', 'Rosskastanie', 'Rosskastanien', 'Rowan_Atkinson', 'Roy_Lichtenstein', 'Rugby', 'Rundebrua', 'Rungholt', 'Russell_Jones', 'Ryokan', 'Römische_Bürgerkriege', 'Rösslitram', 'STS-114', 'Saddam_Hussein', 'Sake', 'San_Marino', 'Sandburg', 'Sandmännchen', 'Sankt_Petersburg', 'Sankt-Michaelskirche_Berlin', 'Sarja', 'Satyendra_Nath_Bose', 'Schaltsekunde', 'Schiedsrichter-Skandal_2005', 'Schmieden', 'Schnabeltier', 'Schokolade', 'Schwarzer_Holunder', 'Schwarzer_Tod', 'Schwebebahn_Dresden', 'Schweizerdeutsch', 'Sealand', 'Secondo', 'Segelfalter', 'Seifenblase', 'Seldschuken', 'Sendeanlagenabgabe', 'Siemens-Martin-Ofen', 'Silvester_I._(Papst)', 'Silvester_I.', 'Silvester', 'Simon_Wiesenthal', 'Skagerrakschlacht', 'Skellig_Michael', 'Snooker', 'Softwarepatente', 'Sommer-Paralympics_2004', 'Sonnenbrand', 'Sonnencreme', 'Soziales_Verhalten_in_Japan', 'SpaceShipOne', 'Spaceshuttle', 'Spannstahl', 'Spargel', 'Spex', 'Spätantike', 'Sri_Lanka', 'Stanley_Kubrick', 'Stephen_King', 'Stirling_Castle', 'Straße_von_Bonifacio', 'Studiengebühr', 'Städte_und_Landschaften_im_Oman', 'Super_Mario', 'Supraleiter', 'Surtsey', 'Susan_Sontag', 'Sushi', 'Swesda', 'Swetlana_Alexandrowna_Kusnezowa', 'Sylvester_und_Tweety', 'Sächsische_Postmeilensäule', 'Südostanatolien-Projekt', 'Südschleswigscher_Wählerverband', 'Tabakpfeife', 'Tabakspfeife', 'Tael', 'Taipei_101', 'Taklamakan', 'Tangram', 'Tara_(Ort)', 'Tee', 'Teebeutel', 'Terroranschläge_am_7._Juli_2005_in_London', 'Teufelsbrücke', 'The_Ganglords', 'The_Undertones', 'Thea_Rasche', 'Thelonious_Monk', 'Thomas_Klestil', 'Thomastag', 'Thunersee', 'Timofei_Wassiljewitsch_Prochorow', 'Timofej_Wasiljewitsch_Prochorow', 'Tobin-Steuer', 'Toiletten_in_Japan', 'Toll_Collect', 'Tour_de_France_2004', 'Tour_de_France', 'Trimethylborat', 'Tropheus', 'Tropischer_Wirbelsturm', 'Tsunami', 'Tundra', 'U-Bahn_Berlin', 'UN-Sicherheitsrat', 'US-Präsidentschaftswahlen_2004', 'Uhu_(Art)', 'Ulmer_Schachtel', 'Urban_legend', 'Urknall', 'Urmeter', 'Ursprünge_des_Hip_Hop', 'Urteil_des_Bundesverfassungsgerichts_zu_Neuwahlen_2005', 'Valentinstag', 'Vasco_da_Gama', 'Vassal_Gadoengin', 'Vertrag_über_eine_Verfassung_für_Europa', 'Vertrauensfrage_(Grundgesetz)', 'Very_Large_Array', 'Via_Claudia_Augusta', 'Visa-Affäre', 'Visual_Kei', 'Viterbi-Algorithmus', 'Vokaltrapez', 'Volmer-Erlass', 'Voyager_1', 'Wachau', 'Wahlsystem', 'Walchensee', 'Walnüsse', 'Warschauer_Straße_(Berlin)', 'Warwick_Castle', 'Wasser', 'Wasserbüffel', 'Weihnachten', 'Weinbau_in_Kanada', 'Weinbau', 'Weingesetz', 'Weinglas', 'Weisse_Rose', 'Weißes_Labkraut', 'Weißschnauzendelfin', 'Weltjugendtag_2005', 'Weltraumschrott', 'Weltsozialforum', 'Weltwirtschaftsforum', 'Wendehals_(Vogel)', 'Wendehals', 'Wetten_dass..?', 'Wiener_Kanalisation', 'Wiener_Wasserversorgung', 'Wikingerzeit_auf_den_Färöern', 'Wiktor_Janukowytsch', 'Wiktor_Juschtschenko', 'William_Westmoreland', 'Willy_Brandt', 'Wim_Duisenberg', 'Wimbledon_Championships', 'Wimper-Mannsschild', 'Wolke', 'Wurstkatastrophe', 'Wuxia', 'Würzburger_Stein', 'Yang-Stil_Taijiquan', 'Yassir_Arafat', 'Yasukuni', 'Yes_(Band)', 'Zahlensystem', 'Zauberformel', 'Zeit_der_Streitenden_Reiche', 'Zeugma_(Stadt)', 'Zoo_Zürich', 'Zottige_Wicke', 'Zugsicherungssystem', 'Zwergenmythos', 'en:David_Irving', 'Äquinoktium', 'ß'

)
     AND (
          (cur_text LIKE '%[[Bild:%') OR
          (cur_text LIKE '%[[Image:%')
     )
     AND (
          (cur_text LIKE '%Literatur%') OR
          (cur_text LIKE '%Weblinks%')
     )
     AND (cur_text NOT LIKE '%[[Kategorie:Jahrestag%') AND (cur_text NOT LIKE '%[[Kategorie: Jahrestag%')
     AND (cur_text NOT LIKE '%[[Kategorie:Jahr (20. Jh.)%') AND (cur_text NOT LIKE '%[[Kategorie: Jahr (20. Jh.)%')
     AND (cur_text NOT LIKE '%[[Kategorie:Ort in%') AND (cur_text NOT LIKE '%[[Kategorie: Ort in%')
     AND (cur_text NOT LIKE '%[[Kategorie:Ort im%') AND (cur_text NOT LIKE '%[[Kategorie: Ort im%')
     AND (cur_text NOT LIKE '%[[Kategorie:Ortsteil%') AND (cur_text NOT LIKE '%[[Kategorie: Ortsteil%')
     AND (cur_text NOT LIKE '%[[Kategorie:Stadtteil%') AND (cur_text NOT LIKE '%[[Kategorie: Stadtteil%')
     AND (cur_text NOT LIKE '%[[Kategorie:Liste%') AND (cur_text NOT LIKE '%[[Kategorie: Liste%')
     AND (cur_text NOT LIKE '%[[Kategorie:Bezirk%') AND (cur_text NOT LIKE '%[[Kategorie: Bezirk%')
     AND (cur_text NOT LIKE '%[[Kategorie:Regierungsbezirk%') AND (cur_text NOT LIKE '%[[Kategorie: Regierungsbezirk%')
     AND (cur_text NOT LIKE '%((stub))%')
     ORDER BY cur_random
     LIMIT 500;

Die Abfrage aus dem Dump vom 13. Juli 2005 zeigt derzeit die unten gezeigte Liste der ersten 500 Einträge. Derzeit findet die Abfrage 26290 mögliche Artikel, die ersten 500 sind hier gelistet.

Kommentare und Vorschläge dazu bitte auf der Diskussionsseite machen.

Das Ergebnis der Abfrage sollte hier zu finden sein:

Von Von

[Bearbeiten | Quelltext bearbeiten]

Artikel, die "von von" enthalten (Stand: Dump vom Juli 2005), ausgenommen einige Artikel, die korrekterweise "von von" enthalten und Artikel, die 'davon von' oder 'hiervon von' enthalten:

 SELECT concat('*[[',cur_title,']]','<br>'),
 concat(
  '<no','wiki>',
  SUBSTRING(cur_text,INSTR(cur_text,'von von')-40,40),
  '</no','wiki>',
  '\'\'\'von von\'\'\'',
  '<no','wiki>',
  SUBSTRING(cur_text,INSTR(cur_text,'von von')+7,40),
  '</no','wiki>',
  '<br>'
 )
 FROM cur
 WHERE cur_namespace=0
 AND cur_is_redirect=0
 AND cur_text like '%von von%'
 AND cur_title not in (
 'Adjusted-Winner-Methode',
 'Alexander_von_Falkenhausen', 'Alkippe',
 'Andrew-Schnabelwal', 'Pinchas_Lavon', 'Phöbus',
 'Paläontologisches_Museum_Nierstein', 'Opernhaus_Hannover',
 'Friedrich_Leopold_zu_Stolberg-Stolberg', 'Dietmar_Munier',
 'Bottrop', 'Bitmap', 'Geschichte_Israels', 'Hasso_von_Manteuffel',
 'Hermann_von_Barth', 'Hofbieber', 'Jürgen_Aschoff', 'Karl_Leisner',
 'Kurt_Vonnegut', 'Martin_Wilhelm_Kutta', 'Nürnberger_Prozess_gegen_die_Hauptkriegsverbrecher',
 'Lucas_Jacobson_Debes', 'Kreatives_Milieu', 'Schlacht_bei_Charkow', 'Rhizopon', 'Reckahn',
 '6._Zusatz_zur_Verfassung_der_Vereinigten_Staaten_von_Amerika', 'American_Wrestling_Association',
 'Aribert_Rothenberger', 'Palant', 'Burg_Vondern', 'Franz_von_Papen', 'John_Irving', 'Manderlay',
 'Burg_Reisensburg', 'Mission_Erde', 'Paul_von_Hindenburg', 'Santiago_María_García_de_la_Rasilla_Domínguez', 'Karl_Alexander_von_Müller'
 )
 AND cur_text not like '%davon von%'
 AND cur_text not like '%hiervon von%'
 AND cur_text not like '%von voneinander%'
 

Ergebnis:

Addresse

[Bearbeiten | Quelltext bearbeiten]
 SELECT concat('*[[',cur_title,']]','<br>'),
 concat(
  '<no','wiki>',
  SUBSTRING(cur_text,INSTR(cur_text,'Addresse')-40,40),
  '</no','wiki>',
  '\'\'\'', 'Addresse', '\'\'\'',
  '<no','wiki>',
  SUBSTRING(cur_text,INSTR(cur_text,'Addresse')+length('Addresse'),40),
  '</no','wiki>',
  '<br>'
 )
 FROM cur
 WHERE cur_namespace=0
 AND cur_is_redirect=0
 AND cur_title not in ('Hallo-Welt-Programm')
 AND (cur_text like '%Addresse%' or cur_text like '%addresse%')
 AND cur_text not like '%Addresses%'
 AND cur_text not like '%Addressed%'
 AND cur_text not like '%addresses%'
 AND cur_text not like '%addressed%'
 AND cur_text not like '%Addresse ver gemeinschaft%';
 

Ergebnis siehe

alle erledigt

Agendas

[Bearbeiten | Quelltext bearbeiten]
 SELECT concat('*[[',cur_title,']]','<br>'),
 concat(
  '<no','wiki>',
  SUBSTRING(cur_text,INSTR(cur_text,'Agendas')-40,40),
  '</no','wiki>',
  '\'\'\'', 'Agendas', '\'\'\'',
  '<no','wiki>',
  SUBSTRING(cur_text,INSTR(cur_text,'Agendas')+length('Agendas'),40),
  '</no','wiki>',
  '<br>'
 )
 FROM cur
 WHERE cur_namespace=0
 AND cur_is_redirect=0
 AND cur_title NOT IN ('Agenda_21')
 AND (cur_text like concat('%Agendas%') OR cur_text like concat('%agendas%')) 
 AND cur_text NOT LIKE '%Agendasetting%' 
 AND cur_text NOT LIKE '%Magendassel%'
 AND cur_text NOT LIKE '%magendassel%';
 

alliert

[Bearbeiten | Quelltext bearbeiten]
 SELECT concat('*[[',cur_title,']]','<br>'),
 concat(
  '<no','wiki>',
  SUBSTRING(cur_text,INSTR(cur_text,'Alliert')-40,40),
  '</no','wiki>',
  '\'\'\'', 'Alliert', '\'\'\'',
  '<no','wiki>',
  SUBSTRING(cur_text,INSTR(cur_text,'Alliert')+7,40),
  '</no','wiki>',
  '<br>'
 )
 FROM cur
 WHERE cur_namespace=0
 AND cur_is_redirect=0
 AND (cur_text like concat('%', 'alliert', '%') OR cur_text like concat('%', 'Alliert', '%'))
 AND cur_text not like '%installiert%'
 AND cur_text not like '%kristalliert%'
 AND cur_text not like '%falliert%'
 AND cur_text not like '%metalliert%'
 ;
 

Ergebnisse

Beispiel

[Bearbeiten | Quelltext bearbeiten]
 SELECT concat('*[[',cur_title,']]','<br>'),
 concat(
  '<no','wiki>',
  SUBSTRING(cur_text,INSTR(cur_text,'Bei')-40,40),
  '</no','wiki>',
  '\'\'\'', 'Bei', '\'\'\'',
  '<no','wiki>',
  SUBSTRING(cur_text,INSTR(cur_text,'Bei')+'Bei',40),
  '</no','wiki>',
  '<br>'
 )
 FROM cur
 WHERE cur_namespace=0
 AND cur_is_redirect=0
 AND cur_title not in ('Tippfehler')
 AND (cur_text like '%Beipiel%' OR cur_text like '%Beispei%' OR
     cur_text like '%beipiel%' OR cur_text like '%beispei%')
 ;
 

alle erledigt

[Bearbeiten | Quelltext bearbeiten]

Die ersten 200 Artikel, die genau einen Brokenlink haben.

 SELECT concat('*[[',c1.cur_title,']]',' [[',p.pl_title,']]<br>'), COUNT(*)
 FROM pagelinks p, cur c1
 WHERE c1.cur_namespace = 0
 AND c1.cur_is_redirect = 0
 AND c1.cur_id = p.pl_from
 AND c1.cur_title like 'Ac%'
 AND NOT EXISTS ( SELECT * FROM cur c2 WHERE c2.cur_namespace = p.pl_namespace AND c2.cur_title = p.pl_title )
 GROUP BY p.pl_from
 HAVING COUNT(*) = 1
 LIMIT 200;
 
[Bearbeiten | Quelltext bearbeiten]

Diese Abfrage ist ein erster Versuch, um kompliziertere Abfragen zu bauen.

SELECT c1.cur_namespace, c1.cur_title, c1.cur_id, c2.cur_id, c2.cur_title
FROM links l, cur c1, cur c2
WHERE l.l_from = c1.cur_id
AND l.l_to = c2.cur_id
AND c1.cur_namespace = 0
AND c1.cur_is_redirect = 0
AND c1.cur_text like '%[[' || c2.cur_title || '|%'
LIMIT 100
SELECT c1.cur_namespace, c1.cur_title, c1.cur_id, c2.cur_namespace, c2.cur_title, c2.cur_id
FROM links l, cur c1, cur c2
WHERE l.l_from = c1.cur_id
AND c1.cur_namespace = 0
AND c1.cur_is_redirect = 0
AND l.l_to = c2.cur_id
AND c1.cur_text like '%[[' || c2.cur_title || '|%'
LIMIT 100
SELECT c1.cur_namespace, c1.cur_title, c1.cur_id, c2.cur_namespace, c2.cur_title, c2.cur_id
FROM cur c1, cur c2
WHERE c1.cur_namespace = 0
AND c1.cur_is_redirect = 0
AND c1.cur_text like concat('%[[',c2.cur_title,'|%')
LIMIT 200

Umlaute

[Bearbeiten | Quelltext bearbeiten]
 SELECT cur_namespace, cur_title, cur_timestamp 
 FROM cur 
 WHERE cur_namespace = 0
 AND cur_is_redirect = 0
 AND (cur_text like '%ae%' OR cur_text like '%AE%')
 AND cur_title NOT IN ('AEIOU','1467')
 AND cur_text NOT LIKE ('%Michael%') 
 AND cur_text NOT LIKE ('%Ismael%')
 AND cur_text NOT LIKE ('%israel%')
 AND cur_text NOT LIKE ('%Israel%')
 AND cur_text NOT LIKE ('%Aemilianus%')
 AND cur_text NOT LIKE ('%Raffael%')
 AND cur_text NOT LIKE ('%Nathanael%')
 AND cur_text NOT LIKE ('%Raphael%')
 AND cur_text NOT LIKE ('%Aero%')
 AND cur_text NOT LIKE ('%SHAEF%')
 AND cur_text NOT LIKE ('%Caesar%')
 AND cur_text NOT LIKE ('%Maestoso%')
 AND cur_text NOT LIKE ('%maestoso%')
 AND cur_text NOT LIKE ('%Nicolae%')
 AND cur_text NOT LIKE ('%Naevius%')
 AND cur_text NOT LIKE ('%Aegidius%')
 AND cur_text not like '%Kim Dae Jung%'
 LIMIT 200
 


 SELECT cur_namespace, cur_title, cur_timestamp 
 FROM cur 
 WHERE cur_namespace = 0
 AND cur_is_redirect = 0
 AND 
 (cur_text like '%oe%' OR cur_text like '%OE%')
 AND cur_title NOT IN ('AEIOU','1467')
 LIMIT 200
 
 SELECT cur_namespace, cur_title, cur_timestamp 
 FROM cur 
 WHERE cur_namespace = 0
 AND cur_is_redirect = 0
 AND 
 (cur_text like '%ue%' OR cur_text like '%UE%')
 AND cur_title NOT IN ('AEIOU','1467')
 AND cur_text NOT LIKE '%Frauen%'
 AND cur_text NOT LIKE '%Samuel%'
 AND cur_text NOT LIKE '%aktuell%'
 AND cur_text NOT LIKE '%dauer%'
 AND cur_text NOT LIKE '%Dauer%'
 AND cur_text NOT LIKE '%Schauen%'
 AND cur_text NOT LIKE '%schauen%'
 AND cur_text NOT LIKE '%Bauer%'
 AND cur_text NOT LIKE '%bauer%'
 AND cur_text NOT LIKE '%true%'
 AND cur_text NOT LIKE '%Quell%'
 AND cur_text NOT LIKE '%Blue%'
 AND cur_text NOT LIKE '%konsequent%'
 AND cur_text NOT LIKE '%neue%'
 AND cur_text NOT LIKE '%sexuell%'
 AND cur_text NOT LIKE '%zuerst%'
 AND cur_text NOT LIKE '%Aue%'
 AND cur_text NOT LIKE '%Donaueschingen%'
 LIMIT 200
 

dre

[Bearbeiten | Quelltext bearbeiten]
 SELECT cur_namespace, cur_title, cur_timestamp 
 FROM cur 
 WHERE cur_namespace = 0
 AND cur_is_redirect = 0
 AND cur_title not in ('August_Hinrichs', 'Grimms_Märchen', 'OutKast', 'Fishbone', 'Bro_gozh_ma_zadoù', 'Christina_Milian', 'Hermann_Claudius', 'Liste_von_Märchen', 'Monica_Arnold', 'Niederlausitzer_Eisenbahn-Gesellschaft', 'The_Diary_of_Alicia_Keys')
 AND cur_text like '% dre %'
 AND cur_text not like '%dr. dre%'
 AND cur_text not like '%Dr Dre%'
 LIMIT 200
 

alle erledigt

[[text|text1]]

[Bearbeiten | Quelltext bearbeiten]

Die folgende Abfrage versucht, Verlinkungen anzuzeigen, bei denen der Anzeigetext gleich dem Link ist

 SELECT c.cur_namespace, c.cur_title
 FROM cur c 
 WHERE c.cur_namespace = 0
   AND c.cur_is_redirect = 0
   AND EXISTS (
     SELECT * 
     FROM pagelinks p
     WHERE c.cur_id = p.pl_from
     AND c.cur_text like concat('%[[', p.pl_to, '|', p.pl_to, ']]%')
   )
 LIMIT 200
 


Die folgende Abfrage versucht, Verlinkungen anzuzeigen, bei denen der Anzeigetext auch als Link verfügbar ist

 SELECT c.cur_namespace, c.cur_title
 FROM cur c 
 WHERE c.cur_namespace = 0
   AND c.cur_redirect = 0
   AND EXISTS (
     SELECT * 
     FROM pagelinks p, cur c2
     WHERE c.cur_id = p.pl_from
     AND c.cur_text like concat('%[[', p.pl_to, '|', c2.cur_title, ']]%')
   )
 LIMIT 200
 
[Bearbeiten | Quelltext bearbeiten]

Alle Links im Artikel 'Österreich'

 SELECT p.pl_namespace, p.pl_title
 FROM pagelinks p, cur c1
 WHERE c1.cur_namespace = 0
 AND c1.cur_is_redirect = 0
 AND c1.cur_id = p.pl_from
 AND c1.cur_title like 'Österreich'
 LIMIT 200;
 

Alle Brokenlinks im Artikel 'Österreich'

 SELECT p.pl_namespace, p.pl_title
 FROM pagelinks p, cur c1
 WHERE c1.cur_namespace = 0
 AND c1.cur_is_redirect = 0
 AND c1.cur_id = p.pl_from
 AND c1.cur_title like 'Österreich'
 AND NOT EXISTS ( SELECT * FROM cur c2 WHERE c2.cur_namespace = p.pl_namespace AND c2.cur_title = p.pl_title )
 LIMIT 200;
 

Alle vorhandenn Links im Artikel 'Österreich'

 SELECT p.pl_namespace, p.pl_title
 FROM pagelinks p, cur c1
 WHERE c1.cur_namespace = 0
 AND c1.cur_is_redirect = 0
 AND c1.cur_id = p.pl_from
 AND c1.cur_title like 'Österreich'
 AND EXISTS ( SELECT * FROM cur c2 WHERE c2.cur_namespace = p.pl_namespace AND c2.cur_title = p.pl_title )
 LIMIT 200;
 
[Bearbeiten | Quelltext bearbeiten]

Eine Abfrage, die unnütze Linktexte findet, also Dinge wie [[text|text]]

nicht fertig!

SELECT c.cur_namespace, c.cur_title
FROM cur c
WHERE c.cur_namespace = 0
AND c.cur_redirect = 0
AND c.cur_text like '%%%'
AND substring
AND EXISTS (
 SELECT * 
 FROM CUR c2 
 WHERE 
)
LIMIT 100


Meistbesuchte Seiten

[Bearbeiten | Quelltext bearbeiten]

Die dreißig meistbesuchten Seiten. ACHTUNG: Diese Daten werden in der Tabelle cur anscheinend nicht mehr upgedated!

select cur_title, cur_counter from cur order by cur_counter desc limit 30;

Artikel mit SQL-Abfragen

[Bearbeiten | Quelltext bearbeiten]

Sucht alle Artikel, die "SELECT" und "FROM" enthalten.

 select cur_namespace,cur_title
 from cur
 where cur_title not like '%.css'
 and not (cur_namespace = 4 and
 (cur_title like 'Archiv:L%sch-Logbuch%' or cur_title like 'Archiv:Datei-Logbuch/%'))
 and upper(cur_text) like '%SELECT%FROM%';
 

Ergebnis:

Leider sind bei wikisign die Benutzer-Seiten nicht enthalten, deshalb ist das Ergebnis nicht sehr nützlich...

Kürzere Treffer

[Bearbeiten | Quelltext bearbeiten]

siehe auch Benutzer:SirJective/Wartungslisten/Kürzere_Treffer

 SELECT DISTINCT
        CONCAT('* [[Spezial:Whatlinkshere/',p.pl_title,'|',p.pl_title,']] -> [[',cto.cur_title,']]')
        AS data
   FROM pagelinks p, cur AS cto, cur AS cfrom
  WHERE cto.cur_namespace = 0
    AND cfrom.cur_namespace = 0 and cfrom.cur_id = p.pl_from
    AND NOT EXISTS ( 
       SELECT * 
       FROM cur c 
       WHERE c.cur_namespace = p.pl_namespace AND c.cur_title = p.pl_title )
    AND LENGTH(p.pl_title)>=4
    AND p.pl_title REGEXP '[a-z]'
    AND cto.cur_title = SUBSTRING(p.pl_title, 1, LENGTH(p.pl_title)-1)
  ORDER BY SUBSTRING(p.pl_title, LENGTH(p.pl_title),1), p.pl_title;
 

Homonymzusätze

[Bearbeiten | Quelltext bearbeiten]
 SELECT 
 substring_index(substring_index(cur_title, ')', 1), '(', -1) as Homonymzusatz,
 count(substring_index(substring_index(cur_title, ')', 1), '(', -1)) as Anzahl,
 cur_title as Titel 
 FROM cur WHERE cur_title rlike '.+\\(.+\\)*' AND cur_namespace=0
 GROUP BY Homonymzusatz ORDER BY Homonymzusatz;
 

Weiteres

[Bearbeiten | Quelltext bearbeiten]