Urteil des BSG vom 23.02.2005

BSG: stichprobe, vergleich, zahl, rka, aufwand, wirtschaftlichkeit, abhängigkeit, richtigstellung, verfügung, anwendungsbereich

Bundessozialgericht
Urteil vom 23.02.2005
Sozialgericht Karlsruhe S 1 KA 1281/02
Landessozialgericht Baden-Württemberg L 5 KA 1089/03
Bundessozialgericht B 6 KA 72/03 R
Auf die Revision des Klägers werden das Urteil des Landessozialgerichts Baden-Württemberg vom 20. August 2003,
das Urteil des Sozialgerichts Karlsruhe vom 11. Dezember 2002 und der Widerspruchsbescheid des Beklagten vom
15. März 2002 aufgehoben. Der Beklagte wird verurteilt, über den Widerspruch des Klägers gegen den Bescheid des
Prüfungsausschusses vom 29. Februar 2000 unter Beachtung der Rechtsauffassung des Senats erneut zu
entscheiden. Der Beklagte trägt die Kosten des Verfahrens in allen drei Instanzen. Die Kosten der Beigeladenen
werden nicht erstattet.
Gründe:
I
Streitig ist die Rechtmäßigkeit einer Honorarkürzung wegen unwirtschaftlicher Behandlungsweise.
Der Kläger, als Laborarzt zur vertragsärztlichen Versorgung in E. zugelassen, rechnete im Quartal II/1997 112.610
kurative Behandlungsfälle, 8.617 Mutterschaftsvorsorgefälle und 13 Fälle mit sonstigen Hilfen ab. Dadurch überschritt
er den aus 12 Laborarztpraxen im Bereich der Kassenärztlichen Vereinigung (KÄV) Nordbaden ermittelten
Fachgruppendurchschnitt um 174 % (kurativ) bzw um 192 % (Mutterschaftsvorsorge). Mit dem Fallwert (kurativ) von
136,28 DM lag er 13,1 % über dem Fachgruppendurchschnitt. Bei einzelnen Leistungen überschritt er den
Fachgruppendurchschnitt erheblich.
Auf Grund eines gemeinsamen Prüfantrags der beigeladenen Landesverbände der Krankenkassen und der KÄV
unterzog der Prüfungsausschuss die Honorarabrechnung des Klägers, die zuvor sachlich-rechnerisch richtiggestellt
worden war, der Wirtschaftlichkeitsprüfung. Als Grundlage diente eine gutachterliche Stellungnahme des ebenfalls im
Bereich der KÄV zugelassenen Laborarztes Dr. S., die dieser nach Überprüfung von 11.281 Fällen, in denen
Abrechnungen für die Tage 14. bis 18. April 1997 enthalten waren, angefertigt hatte. Er beschrieb darin 33
Vorgehensweisen, bei denen dem Kläger unwirtschaftliches Handeln vorzuwerfen sei, und schlug zudem die
Durchführung von insgesamt 19 sachlich-rechnerischen Richtigstellungen vor. Auf der Grundlage seiner
Feststellungen regte Dr. S. an, die Abrechnung des Klägers um insgesamt 19.118.690 Punkte oder - fiktiv auf der
Grundlage eines Punktwertes von 10 Pf - um 1.911.869 DM zu kürzen. Dieser Betrag ergab sich durch Hochrechnung
der in der Stichprobe von 10,02 % aller kurativen Fälle festgestellten Unwirtschaftlichkeiten bei den einzelnen
Leistungen auf 100 %.
Der Prüfungsausschuss übernahm in seinem Bescheid vom 29. Februar 2000 den Vorschlag des Gutachters sowie
dessen Begründungen und ergänzte sie hinsichtlich jedes beanstandeten Punktes um Fallbeispiele, die jeweils mit
Patientenname und zugehöriger Krankenkasse bezeichnet waren. Außerdem wandelte er in 68 - nicht näher
bezeichneten - Fällen die vom Kläger abgerechnete Kombination der Leistungen nach den Nummern 4438, 4716 und
4298 des Einheitlichen Bewertungsmaßstabs für vertragsärztliche Leistungen (EBM-Ä (zusammen 2.600 Punkte)) in
Nr 4805 EBM-Ä (250 Punkte) um, wodurch sich die Kürzung um weitere 159.800 Punkte erhöhte. Insgesamt setzte
der Prüfungsausschuss eine Honorarkürzung von 1.927.849,00 DM vor Berücksichtigung des
Auszahlungspunktwertes fest.
Der Kläger berief sich in seinem Widerspruch gegen diese Entscheidung zunächst darauf, dass Dr. S. als sein
unmittelbarer Konkurrent befangen sei, weil ihm die verfügten Kürzungen über eine Erhöhung des Punktwertes der
Fachgruppe unmittelbar zugute kämen. Des weiteren bezog er sich auf eine gutachtliche Stellungnahme zu den 33
beanstandeten Punkten, die Prof. Dr. M. vom Institut für Klinische Chemie des Universitätsspitals Zürich auf seinen
Auftrag hin angefertigt hatte. Prof. Dr. M. gelangte zu der Bewertung, die ausgesprochenen Kürzungen seien ganz
überwiegend nicht gerechtfertigt. Der Beklagte beauftragte daraufhin den im Bereich der KÄV Hessen
niedergelassenen Laborarzt Dr. R. mit der Begutachtung der Beschwerdesache. Dr. R. stellte in seinem Gutachten
den 33 im Prüfbescheid beanstandeten Punkten jeweils die Stellungnahme des Prof. Dr. M. gegenüber und gab dazu
seine eigene Bewertung unter Auflistung sämtlicher betroffener Fälle ab. In einem zusätzlichen 34. Punkt listete er
weitere von ihm festgestellte Auffälligkeiten auf. Sein Kürzungsvorschlag belief sich auf insgesamt 19.400.220
Punkte. Das Gutachten des Dr. R. wurde den Prozessbevollmächtigten des Klägers am 12. September 2000
übersandt. Mit Telefax vom 5. Oktober 2000 lehnten diese Dr. R. ebenfalls wegen Besorgnis der Befangenheit ab, weil
auch er in beruflicher Konkurrenz zum Kläger stehe.
Im weiteren Verlauf des Widerspruchsverfahrens wurde ein Gutachten des Statistikers Prof. Dr. G. vom 28.
September 1999 zur "Genauigkeit einer stichprobenweisen Einzelfallprüfung in Abhängigkeit von der Gesamtzahl der
Behandlungsfälle des zu prüfenden Kassenarztes", das die KÄV im Prüfungsverfahren hinsichtlich des nachfolgenden
Quartals III/1997 eingeholt hatte, eingeführt. Prof. Dr. G. gelangte darin zu dem Ergebnis, dass die Prüfung und
Hochrechnung einer Stichprobenquote von 0,9 % einer Praxis mit 30.000 Fällen (dh 270 Fälle) je Quartal dieselbe
Relation - nicht die absolute Höhe - einer zumutbaren fehlerhaften Kürzung zur Folge habe wie die Hochrechnung des
Prüfungsergebnisses einer Stichprobenquote von 20 % (oder 200 Fällen) bei einer Praxis mit 1.000
Behandlungsfällen. Der Kläger erhob Einwendungen gegen die Richtigkeit dieses Gutachtens, indem er eine kritische
Würdigung durch Prof. Dr. M. vorlegte.
Der Beklagte wies den Widerspruch des Klägers zurück. In dem 211 Seiten umfassenden Widerspruchsbescheid vom
15. März 2002 ist ausgeführt, der Befangenheitsantrag gegen den Sachverständigen Dr. R. sei durch Beschluss des
Beschwerdeausschusses abgelehnt worden, weil er nicht innerhalb von zwei Wochen nach Kenntniserlangung von der
Person des Sachverständigen gestellt worden sei und zudem kein Befangenheitsgrund ersichtlich sei. Auch der
Beweisantrag des Klägers auf Einholung eines weiteren statistischen Gutachtens von Prof. Dr. C. von der Universität
Bonn sei abzulehnen gewesen, weil dieser über keine besseren oder anderen Erkenntnisquellen verfüge als Prof. Dr.
G.
Der Beklagte sah unter Berufung auf die Ausführungen von Prof. Dr. G. die Prüfmethode der "stichprobenweisen
Einzelfallprüfung" als sachgerecht und praktikabel an. Danach genüge bei der Praxis des Klägers eine
Stichprobenquote von 10 % für eine ausreichend genaue Hochrechnung. Für die Stichprobe seien die fünf
Abrechnungstage 14. bis 18. April 1997 zufällig ausgewählt worden, welche ca 10 % der Fälle der Praxis umfassten.
Diese Auswahl sei nicht nur praktikabel, sondern auch zweckmäßig, weil hierdurch eine Momentaufnahme der
gesamten Laborpraxis entstehe; dass sich "Ausreißertage" darunter befänden, sei nicht ersichtlich. Ein statistischer
Vergleich mit der Fachgruppe der Laborärzte sei nicht sachgerecht, da bei kleineren Fachgruppen - hier 12 Laborärzte
im Bereich der KÄV Nordbaden - die stichprobenweise Einzelfallprüfung mit Hochrechnung nach Auffassung des
Sachverständigen Prof. Dr. G. zu genaueren Ergebnissen führen könne als der Vergleich des zu prüfenden Arztes mit
wenigen Ärzten seines Fachgebiets. Er - der Beklagte - sei auch berechtigt, andere als in der Prüfvereinbarung
verankerte Prüfmethoden anzuwenden, wenn in besonders gelagerten Fällen keine der bisher in der Praxis
entwickelten und durch die Rechtsprechung bestätigten Prüfmethoden geeignet seien.
In der Sache schloss sich der Beklagte jeweils den Darlegungen seines Sachverständigen Dr. R. vollinhaltlich an und
stellte die daraus resultierenden Streichungen bzw Umsetzungen in einer Liste zusammen. Den insgesamt für
zutreffend erachteten Kürzungsbetrag ermittelte er, indem zunächst für jede einzelne Abrechnungsnummer deren für
unwirtschaftlich erachtete Gesamtzahl innerhalb aller Beanstandungen festgestellt wurde. Dies ergab einen Katalog
von 94 beanstandeten Abrechnungsnummern. Bei 28 Gebührenordnungsnummern in der geprüften Stichprobe von
11.281 Fällen wurde die Streichung einer einzigen Leistung verfügt. Wie bei allen anderen Nummern auch wurden
sodann die zu streichenden Leistungen auf 100 % der Fälle hochgerechnet. Dem so ermittelten Wert an zu
streichenden Leistungen wurde die Ansatzhäufigkeit der betreffenden Leistung in der Anzahlstatistik nach sachlich-
rechnerischer Richtigstellung gegenübergestellt. Sofern die Häufigkeit der Leistungsnummer in der Anzahlstatistik
geringer war als die Zahl der nach Hochrechnung zu streichenden Leistungen, wurde diese geringere Zahl gestrichen,
dh die Leistungsnummer blieb unvergütet. Die Gesamtzahl der auf diese Weise zu kürzenden Leistungen belief sich
auf 20.714.880 Punkte. Hiervon wurden - ebenfalls nach Hochrechnung - 202.250 Punkte im Hinblick auf erfolgte
Umsetzungen zugunsten des Klägers abgezogen, sodass sich ein Kürzungsvolumen von 20.512.630 Punkten ergab.
Von diesem bereinigten Kürzungsvolumen zog der Beklagte sodann einen Sicherheitsabschlag in Höhe von 5 % ab,
sodass die verbleibende Kürzung 19.486.998,5 Punkte umfasste. Der Beklagte berief sich bei der Bemessung dieses
Sicherheitsabschlags auf seinen Ermessensspielraum und darauf, dass bereits bei einer Stichprobenquote von nur
0,9 % der Gesamtfallzahl eine Konfidenzwahrscheinlichkeit von mindestens 95 % gegeben sei, durch die erfolgte
Prüfung von 10 % der Fälle aber ein wesentlich zuverlässigeres Ergebnis erzielt werde. Unter Beachtung des
Verböserungsverbots sei die etwas geringere Kürzung der Honoraranforderung durch den Prüfungsausschuss zu
bestätigen gewesen.
Die Klage gegen den Widerspruchsbescheid ist ebenso wie die Berufung ohne Erfolg geblieben. Das
Landessozialgericht (LSG) hat keine hinreichenden Gründe dafür gesehen, dass der Kläger unter Zugrundelegung der
Ansicht eines objektiv und vernünftig denkenden Beteiligten Misstrauen gegen die Unparteilichkeit des
Sachverständigen Dr. R. haben könne. Der Bescheid des Beklagten sei auch in materieller Hinsicht rechtmäßig. Er
habe zu Recht angenommen, dass die Regelprüfmethode des statistischen Kostenvergleichs wegen der geringen
Größe der Vergleichsgruppe nicht habe herangezogen werden können. Deshalb habe er sich der Methode einer
stichprobenweisen Einzelfallprüfung mit Hochrechnung bedienen dürfen. Angesichts der hohen Zahl an
Behandlungsfällen reiche es aus, wenn nur ungefähr 10 % aller Fälle einer Einzelfallprüfung unterzogen worden seien.
Die von den Prüfgremien in nebenamtlicher Tätigkeit wahrgenommene Wirtschaftlichkeitsprüfung müsse praktikabel
bleiben. Zudem sei die Behandlungsweise des Klägers durch sich wiederholende Untersuchungsabläufe geprägt, bei
denen er aus medizinisch-wissenschaftlichen Gründen immer dieselben Leistungen für erforderlich halte. Aus diesem
Grunde könne bereits anhand weniger Einzelfälle davon ausgegangen werden, dass in allen Fällen, in denen die
jeweiligen Untersuchungen erfolgten, dieselben Leistungen in gleichem Umfang berechnet worden seien. Bei dieser
Sachlage sei es nicht erforderlich gewesen, ein weiteres Sachverständigengutachten zur Genauigkeit der
stichprobenweisen Einzelfallprüfung in Abhängigkeit von der Gesamtzahl der Behandlungsfälle einzuholen. Nicht zu
beanstanden sei auch die zufällige Auswahl der geprüften Behandlungsfälle der Abrechnungstage vom 14. bis 18.
April 1997. Die Behandlungsweise des Klägers sei in dem in den Punkten 1 bis 34 des Widerspruchsbescheids
beschriebenen Umfang unwirtschaftlich. Die Stellungnahmen des Dr. R., auf die sich der Beklagte gestützt habe,
seien nachvollziehbar. Deshalb bestehe kein Anlass, ein Sachverständigengutachten zur Notwendigkeit der vom
Kläger erbrachten Leistungen einzuholen. Auch die Höhe der festgesetzten Honorarkürzung sei rechtsfehlerfrei
ermittelt worden. Der Beklagte sei nicht verpflichtet gewesen, einen höheren Sicherheitsabschlag als 5 % des
errechneten Kürzungsbetrags einzuräumen, da er zu Recht von einer hohen Konfidenzwahrscheinlichkeit
ausgegangen sei. Schließlich habe der Beklagte nicht mehr Leistungen gestrichen, als der Kläger überhaupt
berechnet habe.
Mit seiner Revision rügt der Kläger eine Abweichung von den Anforderungen, die das Bundessozialgericht (BSG) für
die Prüfmethode der Einzelfallprüfung mit Hochrechnung im Urteil vom 8. April 1992 (BSGE 70, 246, 254 f = SozR 3-
2500 § 106 Nr 10 S 52 f) aufgestellt habe und die im Urteil vom 14. Juli 1993 (6 RKa 13/91 - USK 93115) bekräftigt
worden seien. Insbesondere habe der Sicherheitsabschlag nicht auf 5 % reduziert werden dürfen. Darüber hinaus sei
die Durchführung der Einzelfallprüfung fehlerhaft, weil zu keiner Zeit offen gelegt wurde, nach welcher Methode oder
nach welchen abstrakten Kriterien die Stichprobe ausgewählt worden sei; dies verletze das rechtliche Gehör. Das
LSG habe außerdem gegen seine Verpflichtung zur Amtsermittlung verstoßen, indem es kein weiteres statistisches
Gutachten herangezogen und auch kein zusätzliches medizinisch-technisches Gutachten über die Richtigkeit seiner -
des Klägers - Leistungsabrechnung eingeholt habe. Das vom Beklagten und vom LSG zur Stützung seiner Ansicht
verwertete Gutachten des Dr. R. beruhe wesentlich auf dem Vorgutachten des als befangen ausgeschlossenen Dr. S.
und sei daher nicht verwertbar. Die Entscheidung des LSG verletze zudem § 106 Fünftes Buch Sozialgesetzbuch
(SGB V), indem sie die rechtswidrige Wahl der Prüfungsmethode durch den Beklagten gebilligt habe. Eine
eingeschränkte Einzelfallprüfung komme nach der Rechtsprechung des BSG nur in Betracht, wenn aussagekräftigere
Beweismethoden nicht zur Verfügung stünden. Dies sei hier jedoch der Fall, denn die Größe der Vergleichsgruppe von
12 Laborärzten schließe die statistische Vergleichsprüfung nicht aus. Da dem Beklagten bei der Auswahl der
Prüfungsmethode und der Beurteilung der Geeignetheit der statistischen Vergleichsprüfung entgegen der Auffassung
des LSG kein Beurteilungsspielraum zukomme, habe die Einzelfallprüfung mit Hochrechnung nicht durchgeführt
werden dürfen. Weiterhin habe keine Reduzierung der Anforderungen an die Einzelfallprüfung mit Hochrechnung
erfolgen dürfen. Bei den geprüften Laborleistungen müsse berücksichtigt werden, dass derzeit ca 3.500 verschiedene
Untersuchungsleistungen abgerechnet werden könnten, von denen jede einzelne ihre spezifischen Besonderheiten
aufweise. Bei einer derartigen Vielfalt an Leistungen könne eine repräsentative Stichprobe nur erreicht werden, wenn
auch der Umfang der Stichprobe entsprechend groß gewählt werde. Die Halbierung der Stichprobe durch den
Beklagten habe dazu geführt, dass bei zahlreichen Untersuchungsarten nur ein einziger Behandlungsfall mit der
entsprechenden Leistung in der Stichprobe enthalten gewesen sei; Beanstandungen bei diesen geringen Fallzahlen
rechtfertigten indes nicht den Schluss, der Kläger habe in den nicht überprüften gleichartigen Behandlungsfällen in
gleicher Weise unwirtschaftlich gehandelt.
Das LSG habe des weiteren die Grenzen des dem Beklagten zukommenden Beurteilungsspielraums verkannt, indem
es die im Widerspruchsbescheid behaupteten Unwirtschaftlichkeiten trotz seiner - des Klägers - detaillierten
Einwendungen insgesamt und ohne nachvollziehende Prüfung unter Hinweis auf die Besetzung des Beklagten mit
sachkundigen Vertretern akzeptiert habe. Schließlich habe der Beklagte ausweislich seines Bescheids im Rahmen
der Wirtschaftlichkeitsprüfung sachlich-rechnerische Richtigstellungen durchgeführt und deren Ergebnisse von der
Stichprobe auf 100 % hochgerechnet. Das sei nach der gefestigten Rechtsprechung des BSG unzulässig. Zudem
habe er unstatthafte Doppelkürzungen vorgenommen, indem er die Absetzungen auf Grund der Höchstwertregelungen
des EBM-Ä bei zahlreichen im Einzelnen angegebenen Leistungsnummern nicht hinreichend berücksichtigt habe.
Diese stünden den Praxisbudgets in der Wirkung gleich. Für letztere habe das BSG bereits entschieden, dass
Honorarkürzungen bei budgetierten Leistungen grundsätzlich nur mit dem Wert erfolgen dürften, den diese Leistungen
im Budget tatsächlich hätten. Diese Doppelkürzung habe beispielsweise bei der Leistung nach Nr 4417 EBM-Ä dazu
geführt, dass er - der Kläger - auf Grund der Kombination der Kürzungen letztlich keine einzige dieser Leistungen
vergütet erhalten habe.
Der Kläger beantragt ,
das Urteil des Landessozialgerichts Baden-Württemberg vom 20. August 2003, das Urteil des Sozialgerichts
Karlsruhe vom 11. Dezember 2002 und den Bescheid des Beklagten vom 15. März 2002 aufzuheben und den
Beklagten zu verpflichten, erneut über den Widerspruch gegen den Bescheid des Prüfungsausschusses vom 29.
Februar 2000 unter Beachtung der Rechtsauffassung des Gerichts zu entscheiden;
hilfsweise, das Urteil des Landessozialgerichts Baden-Württemberg vom 20. August 2003 aufzuheben und die Sache
zur erneuten Verhandlung und Entscheidung an das Landessozialgericht zurückzuverweisen.
Der Beklagte beantragt,
die Revision zurückzuweisen.
Er hält das Urteil des LSG für zutreffend. Der Kläger habe nicht substantiiert dargelegt, weshalb der Sachverständige
Dr. R. befangen gewesen sein soll. Eine statistische Vergleichsprüfung sei im Hinblick auf die Inhomogenität der nur
aus 12 Laborarztpraxen bestehenden Vergleichsgruppe ausgeschlossen. Zudem habe eine Auswertung der
Anzahlstatistiken des Klägers ergeben, dass 37 % der von ihm abgerechneten Gebührenordnungsnummern nur von
50 % oder weniger Ärzten der Fachgruppe erbracht würden. Die Besonderheiten des Falles hätten es erfordert, bei der
deshalb durchgeführten Einzelfallprüfung mit Hochrechnung eine geringere Zahl von Behandlungsfällen als die bislang
geforderten 20 % aller Fälle zu prüfen. Entgegen dem Vortrag des Klägers habe er - der Beklagte - keine sachlich-
rechnerische Richtigstellung vorgenommen, obwohl er hierzu im Rahmen einer Annexkompetenz ohne weiteres befugt
sei. Auch die Höchstwertregelungen des EBM-Ä seien beachtet worden; die verfügten Kürzungen hätten nicht dazu
geführt, dass für einzelne Leistungen eine Vergütung vollständig entfallen sei. Im Hinblick auf die standardisierten
Abrechnungsvorgänge sei es nicht erforderlich gewesen, einen höheren Sicherheitsabschlag als 5 % zu gewähren.
Die zu 1. beigeladene KÄV Baden-Württemberg, die zum 1. Januar 2005 die Rechtsnachfolge der ursprünglich
beigeladenen KÄV Nordbaden angetreten hat, stellt keinen Antrag und schließt sich im Übrigen den Ausführungen des
Beklagten an. Die weiteren Beigeladenen äußern sich im Revisionsverfahren nicht.
II
Die Revision des Klägers ist begründet. Die Vorinstanzen haben die Klage gegen den Bescheid des Beklagten zu
Unrecht abgewiesen. Dieser ist rechtswidrig und beschwert den Kläger im Sinne von § 54 Abs 1 Satz 2
Sozialgerichtsgesetz (SGG). Der Beklagte war nicht berechtigt, von der Regelprüfmethode einer statistischen
Vergleichsprüfung abzuweichen. Außerdem hat er bei Durchführung der Einzelfallprüfung mit anschließender
Hochrechnung ohne rechtfertigenden Grund gegen die ihn bindenden Festlegungen zu dieser Methode in der
Prüfvereinbarung verstoßen. Bereits aus diesen Gründen muss der Bescheid aufgehoben und der Beklagte
verpflichtet werden, unter Beachtung der Rechtsauffassung des Senats erneut über den Widerspruch des Klägers
gegen den Bescheid des Prüfungsausschusses zu entscheiden. Die darüber hinaus von der Revision geltend
gemachten Verfahrensmängel sind deshalb ohne Bedeutung.
Rechtsgrundlage für Honorarkürzungen wegen unwirtschaftlicher Behandlungsweise ist § 106 Abs 2 Satz 1 SGB V in
der hier noch maßgeblichen Fassung des Gesundheitsstrukturgesetzes (GSG - vom 21. Dezember 1992, BGBl I
2266). Danach wird die Wirtschaftlichkeit der Versorgung durch arztbezogene Prüfungen ärztlicher und ärztlich
verordneter Leistungen nach Durchschnittswerten beurteilt. Nach den hierzu von der Rechtsprechung entwickelten
Grundsätzen ist die statistische Vergleichsprüfung die Regelprüfmethode (stRspr, s BSG SozR 4-2500 § 106 Nr 4
RdNr 5, mwN). Die Abrechnungswerte des Arztes werden mit denjenigen der Fachgruppe oder mit denen einer nach
verfeinerten Kriterien gebildeten engeren Vergleichsgruppe im selben Quartal verglichen. Ergänzt durch die sog
intellektuelle Betrachtung, bei der medizinisch-ärztliche Gesichtspunkte berücksichtigt werden, ist dies die Methode,
die typischerweise die umfassendsten Erkenntnisse bringt. Ergibt die Prüfung, dass der Behandlungsaufwand des
Arztes je Fall bei dem Gesamtfallwert, bei Sparten- oder Einzelleistungswerten in offensichtlichem Missverhältnis zu
dem durchschnittlichen Aufwand der Vergleichsgruppe steht, ihn nämlich in einem Ausmaß überschreitet, das sich im
Regelfall nicht mehr durch Unterschiede in der Praxisstruktur oder in den Behandlungsnotwendigkeiten erklären lässt,
hat das die Wirkung eines Anscheinsbeweises der Unwirtschaftlichkeit (stRspr, zB BSG SozR 4-2500 § 106 Nr 3
RdNr 8, mwN).
Die Prüfgremien sind jedoch berechtigt und verpflichtet, ausnahmsweise auch andere Prüfmethoden anzuwenden oder
neu zu entwickeln, wenn sich im Einzelfall die Prüfung nach Durchschnittswerten als nicht aussagekräftig oder nicht
durchführbar erweist (BSGE 75, 220, 224 = SozR 3-2500 § 106 Nr 24 S 135; BSGE 84, 85, 86 f = SozR 3-2500 § 106
Nr 47 S 250 f; SozR aaO Nr 55 S 310 f). Im Interesse einer gleichmäßigen Rechtsanwendung hat der Senat allerdings
betont, dass plausible Gründe vorliegen müssen, um von einer Vergleichsprüfung nach Durchschnittswerten
abzusehen (BSGE 77, 53, 58 = SozR 3-2500 § 106 Nr 33 S 189). So ist als Voraussetzung für die Anwendung eines
sog Vertikalvergleichs verlangt worden, dass einem Horizontalvergleich nach Durchschnittswerten die Grundlage
entzogen ist, weil entweder der zu prüfende Arzt eine unvergleichbare individuelle Praxisausrichtung hat oder weil
dessen Grundannahme, die Vergleichsgruppe handele im Durchschnitt insgesamt wirtschaftlich, nicht zutrifft (BSGE
84, 85, 86 = SozR 3-2500 § 106 Nr 47 S 250; SozR aaO Nr 55 S 308). Der Senat hat zudem klargestellt, dass
generelle Bedenken der Prüfgremien gegen die Geeignetheit der Regelprüfmethode einer statistischen
Vergleichsprüfung nach Durchschnittswerten keine Rechtfertigung dafür sein können, zu der Methode einer
repräsentativen Einzelfallprüfung mit anschließender Hochrechnung überzugehen. Deshalb ist die Begründung, eine
repräsentative Einzelfallprüfung führe zu einem genaueren und gerechteren Ergebnis als die Prüfung nach
Durchschnittswerten, als Überschreitung der Grenzen des Beurteilungsspielraums zurückgewiesen worden (BSGE 77,
53, 56 = SozR 3-2500 § 106 Nr 33 S 187).
Darüber hinaus geht der Senat in ständiger Rechtsprechung davon aus, dass die Vergleichsprüfung nach
Durchschnittswerten nicht nur hinsichtlich des Gesamtfallwertes, sondern unter der Voraussetzung einer
hinreichenden Vergleichbarkeit ebenso auch zur Überprüfung der Wirtschaftlichkeit des Ansatzes einer einzelnen
Leistungsposition bzw mehrerer zu Leistungssparten zusammengefasster Leistungspositionen des EBM-Ä
herangezogen werden kann (BSG SozR 4-2500 § 106 Nr 3 RdNr 9 mwN; zur Bestimmung der Grenze zum
offensichtlichen Missverhältnis bei Einzelleistungsprüfungen s auch Urteil vom heutigen Tage, B 6 KA 79/03 R - juris).
Die Prüfung nach Durchschnittswerten setzt allerdings voraus, dass die Vergleichsgruppe ausreichend groß und
hinreichend homogen zusammengesetzt ist, um statistisch aussagekräftige Ergebnisse zu erhalten (BSG SozR 3-
2500 § 106 Nr 36 S 204; BSG SozR 4-2500 § 106 Nr 2 RdNr 11 ff). Die Kriterien der Homogenität und der Größe einer
Vergleichsgruppe stehen dabei in einer Wechselbeziehung zueinander in dem Sinne, dass eine Gruppe um so größer
sein muss, je weniger homogen sie ist, während für sehr homogene Gruppen auch kleine Zahlen ausreichend sein
können (Clemens in Schulin, Handbuch des Sozialversicherungsrechts, Band 1, Krankenversicherungsrecht, 1994, §
35 RdNr 58; Engelhard in Hauck/Noftz, SGB V, Stand Dezember 2004, K § 106 RdNr 333 f). In diesem Sinne hat der
Senat für den statistischen Vergleich von Röntgenleistungen bei Internisten eine Gruppengröße von neun Ärzten mit
derselben Röntgengenehmigung für ausreichend erachtet (BSG, Urteil vom 27. April 1982 - 6 RKa 7/79 = USK 82196).
Bei Pathologen hat die Instanzrechtsprechung im Hinblick auf deren hohe Fallzahlen bereits eine aus sieben bis neun
Praxen bestehende Vergleichsgruppe genügen lassen (vgl Engelhard in Hauck/Noftz, aaO RdNr 334).
Das Festhalten an der Prüfung nach Durchschnittswerten als Regelprüfmethode beruht auch darauf, dass diese
Prüfart in ihrem Anwendungsbereich in praktikabler Weise und mit vertretbarem Aufwand zu tragfähigen
Erkenntnissen führt. Auch wenn mit dieser Beweismethode nicht alle Unwirtschaftlichkeiten in vollem Umfang
aufgedeckt werden können, genügt sie doch am besten den Erfordernissen einer effizienten und gleichmäßigen
Wirtschaftlichkeitsprüfung der Quartal für Quartal in sehr großer Zahl anfallenden vertragsärztlichen Leistungen. Dem
gegenüber kann der mit einer eingeschränkten Einzelfallprüfung verbundene Aufwand zur Verifizierung von
Unwirtschaftlichkeiten unter Berücksichtigung aller dem Arzt in jedem Einzelfall zur Verfügung stehenden
Einwendungen um ein Vielfaches höher sein und letztlich - wie der vorliegende Fall zeigt - dazu führen, dass die
Prüfung nicht mehr in angemessener Zeit und mit noch beherrschbarem Aufwand in rechtsstaatlich einwandfreier
Weise abgewickelt werden kann. Die weiteren Prüfmethoden können daher immer nur dann herangezogen werden,
wenn und soweit auf Grund besonderer Umstände die Regelprüfmethode keine beweistauglichen Ergebnisse liefert.
Auf dieser Grundlage können die Gründe, die der Beklagte im Widerspruchsbescheid benannt hat, im vorliegenden
Fall ein Absehen von der Anwendung der Regelprüfmethode der statistischen Vergleichsprüfung nicht rechtfertigen.
Der Beklagte hat ausgeführt, bei kleinen Fachgruppen könne die stichprobenweise Einzelfallprüfung mit Hochrechnung
der Kürzungen zu genaueren Ergebnissen führen als der Vergleich des zu prüfenden Vertragsarztes mit den wenigen
Ärzten seines Fachgebiets. Unabhängig davon, dass bei Laborärzten Praxisbesonderheiten in diesem Sinne nicht
gesehen werden könnten, würden diese auch nur dann zum Tragen kommen, wenn ein Vergleich mit der Fachgruppe
erfolge. Diese Begründung lässt nicht erkennen, dass der Beklagte das Leistungsverhalten in der Fachgruppe anhand
der Abrechnungsstatistiken näher analysiert und auf dieser Grundlage eine Bewertung vorgenommen hat, ob die
Gruppe bei den für die Prüfung wesentlichen Leistungen für einen statistischen Vergleich hinreichend groß und - in
wechselseitiger Abhängigkeit - ausreichend homogen ist.
Von den 12 Laborärzten im Bereich der KÄV erbrachten nach den Angaben der Beigeladenen zu 1. im
Revisionsverfahren immerhin acht Praxen Leistungen in einem Umfang, dass von hauptberuflich in Vollzeit
betriebenen Laboren ausgegangen werden kann. Dies stellt bei entsprechender Homogenität eine für die Prüfung nach
Durchschnittswerten ausreichend große Vergleichsgruppe dar. Darüber hinaus ist eine fehlende Homogenität
insbesondere bei den wenigen Leistungen, die den überwiegenden Teil der vom Beklagten für unwirtschaftlich
erachteten und deshalb gekürzten Leistungen ausmachen, nicht ohne weiteres ersichtlich. Beispielsweise wurde die
Leistung nach Nr 4298 EBM-Ä, auf die fast ein Drittel des gesamten Kürzungsvolumens entfällt, von neun der 12
Laborarztpraxen abgerechnet. Die Leistung nach Nr 4515 EBM-Ä, auf die weitere 20 % der Kürzungssumme entfallen,
brachten 11 Laborärzte in Ansatz. Die Leistung mit dem dritthöchsten Kürzungsbetrag, Nr 4625 EBM-Ä, rechneten 10
der 12 Laborarztpraxen ab, und zwar im Durchschnitt in genau derselben Häufigkeit wie der Kläger. Der Hinweis des
Beklagten darauf, dass bei Laborärzten Praxisbesonderheiten nicht gesehen werden könnten, weist vielmehr darauf
hin, dass er insgesamt von einer relativ homogenen Leistungsstruktur in dieser Fachgruppe ausging. Der Beklagte hat
die Vergleichsgruppe von 12 Laborärzten auch nicht als generell ungeeignet zur Durchführung einer statistischen
Prüfung beurteilt, sondern die Abweichung von der Regelprüfmethode lediglich damit gerechtfertigt, dass die
stichprobenweise Einzelfallprüfung mit Hochrechnung "zu genaueren Ergebnissen führen könne". Diese auch in dem
Gutachten von Prof. Dr. G. nicht näher belegte Möglichkeit rechtfertigt es jedoch nicht, bei kleinen Vergleichsgruppen
generell und ohne Untersuchung ihrer Homogenität von der in § 106 Abs 2 Nr 1 SGB V als Regelprüfmethode
ausgestalteten Durchschnittsprüfung abzusehen und auf die mit erheblichen Nachteilen behaftete eingeschränkte
Einzelfallprüfung mit Hochrechnung auszuweichen. Nur wenn die fehlende Homogenität oder eine zu geringe Größe
der Vergleichsgruppe belegt und auch keine Abhilfe durch eine Vergrößerung der Vergleichsbasis - etwa im Wege der
Einbeziehung der Abrechnungswerte von weiteren Ärzten derselben Fachgruppe aus anderen KÄVen (vgl BSG, Urteil
vom 19. November 1985, 6 RKa 13/84 = USK 85215; Urteil vom 1. Oktober 1990, 6 RKa 32/89 = USK 90102) -
möglich ist, kann auf eine der nachrangigen Prüfmethoden zurückgegriffen werden. Die Darlegungen des Beklagten im
Widerspruchsbescheid lassen eine Prüfung dieser Voraussetzungen nicht sichtbar werden; sie zielen vielmehr darauf,
bei kleinen Vergleichsgruppen in unstatthafter Weise stets der Einzelfallprüfung den Vorzug gegenüber einer Prüfung
nach Durchschnittswerten zu geben.
Auch die Erwägungen im Urteil des SG können nicht plausibel machen, dass die Fachgruppe der Laborärzte im Bezirk
Nordbaden "ausgesprochen inhomogen" ist. Die Inhomogenität der erbrachten ärztlichen Leistungen kann nicht
dadurch belegt werden, dass nur sieben von 12 Praxen (dh 58 %) und nur hinsichtlich ihrer Fallzahlen und
Gesamtfallwerte betrachtet werden. Es mag sein, dass bei näherer Untersuchung einzelner selten oder nur
schwerpunktmäßig von wenigen Praxen erbrachter Leistungsnummern der zahlreichen Leistungen aus Abschnitt O
des EBM-Ä eine hinreichende Homogenität nicht mehr angenommen werden kann. Das rechtfertigt es dann aber nur,
in Bezug auf diese betroffenen Einzelleistungen eine nachrangige Prüfmethode zur Anwendung zu bringen. Bei allen
anderen Leistungsnummern, die keine Anzeichen für Inhomogenität aufweisen, muss es bei der Regelprüfmethode
des Vergleichs nach Durchschnittswerten verbleiben. Denn soweit aussagekräftige statistische Vergleichszahlen
vorliegen, dürfen diese bei der Prüfentscheidung nicht unberücksichtigt bleiben (BSGE 77, 53, 60 = SozR 3-2500 §
106 Nr 33 S 191).
Abgesehen von der nicht ausreichend begründeten Wahl der nachrangigen Prüfmethode einer repräsentativen
Einzelfallprüfung mit anschließender Hochrechnung kann der Bescheid des Beklagten auch noch aus einem anderen
Grund keinen Bestand haben. Denn selbst wenn hinsichtlich einzelner Leistungen diese Prüfmethode in zulässiger
Weise herangezogen werden kann, war der Beklagte doch nicht berechtigt, ohne zwingende Gründe von den in der
Prüfvereinbarung normativ vorgegebenen Regeln für die Durchführung einer repräsentativen Einzelfallprüfung mit
anschließender Hochrechnung abzuweichen. Nach den Feststellungen des Berufungsgerichts ist in § 16 Abs 4 der für
das Prüfungsquartal geltenden Prüfvereinbarung vorgesehen, dass bei der Prüfung einer repräsentativen Anzahl von
Beispielsfällen mindestens 20 % der Fälle zu untersuchen und im Rahmen der Hochrechnung der festgestellten
Unwirtschaftlichkeit auf die Gesamtheit aller Fälle ein Sicherheitsabschlag von 25 % vorzunehmen ist. Diese
Regelung entspricht ersichtlich den Vorgaben, die das BSG als regelmäßige Voraussetzung für die Zuverlässigkeit
dieser Beweismethode aufgestellt hat (BSGE 70, 246, 255 = SozR 3-2500 § 106 Nr 10 S 52 f). Entgegen der
Auffassung der Vorinstanzen ist der Beklagte bei Durchführung der Wirtschaftlichkeitsprüfung grundsätzlich an die
Bestimmungen der Prüfvereinbarung gebunden. Bei der auf der Grundlage von § 106 Abs 3 Satz 1 und 3 SGB V
abgeschlossenen Prüfvereinbarung handelt es sich um einen Normvertrag auf der Ebene des Gesamtvertrags. Zu den
wesentlichen Merkmalen eines solchen Normvertrages gehört es, dass seine Regelungen für die von ihm betroffenen
Beteiligten verbindlich sind. Nur soweit die Vorschriften in der Prüfvereinbarung gegen höherrangiges Recht
verstoßen, insbesondere mit den bundesrechtlichen Vorgaben zur effektiven Überwachung der Wirtschaftlichkeit der
ärztlichen Leistungserbringer nicht vereinbar sind, sind sie nach den allgemeinen Regeln der Normenhierarchie nichtig
und damit auch für den Beklagten nicht maßgeblich (BSGE 77, 53, 60 = SozR 3-2500 § 106 Nr 33 S 191; Nr 51 S
278; Nr 53 S 289 f).
Ein solcher Fall liegt hier indessen nicht vor. Es ist nicht ersichtlich, dass bei Beachtung der Regelungen in § 16 Abs
4 der Prüfvereinbarung eine wirksame Überwachung der Wirtschaftlichkeit der Vertragsärzte im Anwendungsbereich
der Prüfmethode der repräsentativen Einzelfallprüfung mit anschließender Hochrechnung verhindert wird. Wie der
vorliegende Fall zeigt, trägt vielmehr gerade die Heranziehung dieser nachrangigen Prüfmethode ohne zwingenden
Grund zu einem Verlust an Effizienz der Wirtschaftlichkeitsprüfung bei. Wird hingegen der Vorrang der Prüfung nach
Durchschnittswerten auch hinsichtlich der Einzelleistungen beachtet, ist das Problem des Prüfaufwands bei der in der
Prüfvereinbarung vorgeschriebenen Begutachtung von mindestens 20 % der Behandlungsfälle bei übergroßen
Fallzahlen wesentlich entschärft.
Auch hinsichtlich des vorgesehenen Sicherheitsabschlags von 25 % im Rahmen der Hochrechnung der festgestellten
Unwirtschaftlichkeit sind zwingende Gründe für eine Reduzierung nicht erkennbar. Der Sicherheitsabschlag
berücksichtigt den Umstand, dass selbst bei einer Konfidenzwahrscheinlichkeit von 95 % oder höher ein Restrisiko
verbleibt, dass der hochgerechnete Kürzungsbetrag unrichtig und damit zu hoch ist. Die absolute Höhe der -
potentiellen - Unrichtigkeit des Kürzungsvolumens (sog "Konfidenzbereich" der hochgerechneten Kürzung) nimmt mit
zunehmender Gesamtfallzahl der geprüften Grundgesamtheit sogar zu. Da jede einzelne Honorarkürzungsmaßnahme
mit an Sicherheit grenzender Wahrscheinlichkeit rechtmäßig sein muss, ist über einen ausreichend bemessenen
Sicherheitsabschlag zu gewährleisten, dass die hochgerechnete Kürzung in jedem Einzelfall nicht zu hoch ausfällt.
Dem trägt der Abschlag von 25 % Rechnung. Es genügt aus Rechtsgründen nicht, dass sich - wie geltend gemacht -
Kürzungen über den Verlauf längerer Zeiträume nach derselben Methode als "statistisch gerecht" ausgleichen mögen.
Die Rechtmäßigkeit von Honorarkürzungen setzt voraus, dass sie sich in dem zu Grunde liegenden Prüfzeitraum mit
an Gewissheit grenzender Wahrscheinlichkeit als rechtmäßig erweisen (§ 128 SGG). Denn ob es überhaupt über einen
längeren Zeitraum zu nachfolgenden Prüfungen und Kürzungsmaßnahmen kommt, steht nicht fest, zumal die
Wirtschaftlichkeitsprüfung gerade auf eine Verhaltensänderung der Ärzte, bei denen unwirtschaftliches Handeln
festgestellt worden ist, abzielt.
Im Übrigen ist die Vorgehensweise des Beklagten im Einzelnen in sich widersprüchlich und führt zu nicht zu
rechtfertigenden Ergebnissen. So ist bei der Überprüfung der Stichprobe von 11.181 Behandlungsfällen (mit über
15.000 Behandlungsscheinen) der Ansatz von drei Leistungen nach Nr 4378 EBM-Ä als unwirtschaftlich erkannt
worden. Diese drei Leistungen wurden auf 30 als unwirtschaftlich erbrachte Leistungen hochgerechnet, wobei der
Kläger diese Leistung insgesamt nur elfmal abgerechnet hatte. Dieser elfmalige Ansatz der Leistungen ist gestrichen
worden, obwohl der zweifelhafte Ansatz von drei Leistungen bei 11.181 Behandlungsfällen keine Rückschlüsse auf
eine unwirtschaftliche Behandlungsweise zulässt.
Des Weiteren wurden die auf der Grundlage der Einzelfallprüfung mit anschließender Hochrechnung als
unwirtschaftlich erkannten Leistungen in vollem Umfang gestrichen. Dabei wurde nicht berücksichtigt, dass ein
erheblicher Teil der Leistungen bereits nach Anwendung des Regelwerkes nicht vergütet worden war und damit nur die
verbleibenden Ansätze dieser Leistungen in Höhe des als unwirtschaftlich erkannten Prozentsatzes der
hochgerechneten Leistungen hätte gestrichen werden dürfen. Die auch insoweit rechtswidrige Vorgehensweise des
Beklagten wird exemplarisch belegt durch die Kürzung bei der Leistung Nr 4417 EBM-Ä. Auf der Grundlage der
Hochrechnung wurden hier 1.847 Ansätze der Leistung als unwirtschaftlich erkannt. Diese hatte der Kläger insgesamt
3.837 mal abgerechnet. Hiervon setzte die KÄV in Anwendung des Regelwerkes 3.063 Leistungen ab, sodass dem
Kläger noch der Ansatz von 774 Leistungen verblieb. Ausgehend von einer als unwirtschaftlich erkannten Quote von
ca 50 % hätten die verbleibenden Leistungen auch nur in diesem Umfang gekürzt werden dürfen. Unter
Zugrundelegung der nach der Hochrechnung als unwirtschaftlich erkannten 1.847 Leistungsansätze hat der Beklagte
jedoch - im Widerspruch zu seinen eigenen Festlegungen in Höhe eines nur 50 %igen unwirtschaftlichen Ansatzes -
alle 774 verbliebenen Leistungen nach Nr 4417 EBM-Ä als unwirtschaftlich gekürzt.
Der Beklagte hat die im Einzelnen aufgeführten Vorgaben hinsichtlich der Auswahl der Prüfmethode und der konkreten
Durchführung einer gegebenenfalls statthaften repräsentativen Einzelfallprüfung mit anschließender Hochrechnung
nicht beachtet. Sein Bescheid ist daher aufzuheben. Er wird nunmehr unter Beachtung der Rechtsauffassung des
Senats erneut über den Widerspruch des Klägers gegen den Prüfbescheid vom 29. Februar 2000 zu entscheiden
haben.
Die Kostenentscheidung beruht auf § 197a Abs 1 Satz 1 SGG iVm §§ 154 ff Verwaltungsgerichtsordnung (VwGO).
Danach trägt der unterlegene Beklagte die Kosten des Verfahrens in allen Instanzen (§ 154 Abs 1 VwGO). Eine
Aufteilung der Kosten des Revisionsverfahrens gemäß § 155 Abs 2 VwGO ist nicht erforderlich, obwohl der Kläger
hier zunächst - erstmals - eine vollständige Aufhebung des Widerspruchsbescheids beantragt, sich später aber auf
einen Bescheidungsantrag beschränkt hat (§ 99 Abs 3 Nr 2 SGG). Denn der in Verfahren der
Wirtschaftlichkeitsprüfung aus prozessualen Gründen zweckmäßige Bescheidungsantrag ändert nichts daran, dass
das wirtschaftliche Interesse des Vertragsarztes regelmäßig auf die Beseitigung der Honorarkürzungen abzielt (vgl
Wenner/Bernard, NZS 2003, 568, 572), sodass der Streitwert auch bei einem solchen Antrag den vollen
Kürzungsbetrag umfasst. Dementsprechend hat die nachträgliche Beschränkung des Revisionsbegehrens auf eine
Neubescheidung auch bei der Kostengrundentscheidung keine Auswirkungen; der Kläger muss deshalb auch keinen
Bruchteil der Kosten für das Revisionsverfahren tragen. Die Beigeladenen können keine Kostenerstattung
beanspruchen, da sie keine Anträge gestellt haben (§ 162 Abs 3 VwGO).