Sie sind nicht angemeldet.

1

08.02.2011, 16:46

Input/Output Error bei /dev/nvidia0 beim Starten von X

Hallo zusammen!

Vorweg erstmal ein frohes Hallo in die Runde, musste seit fast einem halben Jahr auf Gentoo verzichten (Studium) und freue mich jetzt wieder auf die vielen vielen Fragen, die ich demnächst stellen werde ;-)

Zum eigentlichen Problem, meinem Laptop (Dell E6500, Nvidia Quadro 160M) habe ich vor 2 Tagen eine frische Installation Gentoo verpasst. Beim Einrichten der Nvidia Treiber, nämlich beim Starten vom Xorg Server, fing es an:

Quellcode

1
NVIDIA: could not open the device file /dev/nvidia0 (Input/output error).


Auch ein cat /dev/nvidia0 bringt einen entsprechenden Fehler.

Zu dem Thema hab ich eine ganze Weile im Netz gestöbert: Das Problem gab es immer mal wieder, doch meist war da das Umfeld anders (2+n GPUs) - ich jedoch hab nur den einen. Abhilfe bis jetzt schafft ein Workaround durch "acpi=off" im Grub - doch hier habe ich gehört, dass man das besser nicht machen sollte. Wahrscheinlich ist das auch der Grund, warum z.B. hier im Gnome-Systemmonitor nur noch 1 CPU angezeigt wird.

Ich komme hier nicht weiter, hat jemand einen Rat?

Viele Grüße

Dieser Beitrag wurde bereits 1 mal editiert, zuletzt von »curmudgeon« (12.03.2011, 01:22)


2

11.02.2011, 01:25

Ich komme hier nicht weiter, hat jemand einen Rat?

Nicht wirklich....

Aber magst du mal deine /var/log/Xorg.0.log mit anhängen?! (bitte als Dateianhang)
Und evtl. auch die Ausgaben von

Quellcode

1
2
3
4
5
uname -r
# lspci | grep VGA
# rmmod nvidia
# modprobe -v nvidia
emerge -pv nvidia-drivers

3

11.02.2011, 15:23

Hallo Josef,

anbei die Xorg.0.log und noch meine xorg.conf.

Hier die Ausgabe der Commands:

Quellcode

1
2
3
4
5
6
7
8
9
2.6.36-gentoo-r5
01:00.0 VGA compatible controller: nVidia Corporation G98M [Quadro NVS 160M] (rev a1)
insmod /lib/modules/2.6.36-gentoo-r5/video/nvidia.ko NVreg_DeviceFileMode=432 NVreg_DeviceFileUID=0 NVreg_DeviceFileGID=27 NVreg_ModifyDeviceFiles=1

These are the packages that would be merged, in order:

Calculating dependencies... done![ebuild   R   ] x11-drivers/nvidia-drivers-260.19.36  USE="acpi custom-cflags gtk (-multilib)" 0 kB

Total: 1 package (1 reinstall), Size of downloads: 0 kB




An Treibern hab ich nun ausprobiert:
270.18
260.19.36
260.19.29


USE-Flags: acpi, gtk
Und immer das selbe Ergebnis.
»curmudgeon« hat folgende Dateien angehängt:
  • xorg.conf.txt (1,73 kB - 3 mal heruntergeladen - zuletzt: 11.02.2011, 18:16)
  • Xorg.0.log.txt (7,89 kB - 2 mal heruntergeladen - zuletzt: 11.02.2011, 17:38)

Dieser Beitrag wurde bereits 1 mal editiert, zuletzt von »josef.95« (13.02.2011, 12:05) aus folgendem Grund: Zeilenumbruch im Code Block korrigiert


4

11.02.2011, 16:33

Was sagt denn "lcpci"

Vielleicht musst Du nur den Bus in derXorg.conf anpassen.

Viele Grüße
Alienware 17 R3 16 GB RAM
NVIDIA GTX970 Optimus
Intel Corporation Wireless 8260 AC
Blu-ray Disc ROM & DVD+/-RW
Ubuntu Gnome Desktop
+
Samsung Aktivbook 8, 16 GB DDR3-1666, 2000 GIG SATA
ATI Radeon HD 8870M
Intel Corporation Centrino Advanced-N 6235
Blu-ray Disc ROM & DVD+/-RW
Xbuntu mit debootstrap
+
Intel Core 2 Duo
2 GB MB RAM
ca. 3,5 TB SATA
TBS6980 Dual DVB S2
YaVDR amd64 + VDR1.7.x + XBMC + VDPAU


Mein Overlay:

Quellcode

1
layman -a amielke-overlay

5

11.02.2011, 16:48

Was sagt denn "lcpci"

Vielleicht musst Du nur den Bus in derXorg.conf anpassen.

Viele Grüße
Hallo Planeshift,

hier der Output von lspci:


00:00.0 Host bridge: Intel Corporation Mobile 4 Series Chipset Memory Controller Hub (rev 07)
00:01.0 PCI bridge: Intel Corporation Mobile 4 Series Chipset PCI Express Graphics Port (rev 07)
00:19.0 Ethernet controller: Intel Corporation 82567LM Gigabit Network Connection (rev 03)
00:1a.0 USB Controller: Intel Corporation 82801I (ICH9 Family) USB UHCI Controller #4 (rev 03)
00:1a.1 USB Controller: Intel Corporation 82801I (ICH9 Family) USB UHCI Controller #5 (rev 03)
00:1a.2 USB Controller: Intel Corporation 82801I (ICH9 Family) USB UHCI Controller #6 (rev 03)
00:1a.7 USB Controller: Intel Corporation 82801I (ICH9 Family) USB2 EHCI Controller #2 (rev 03)
00:1b.0 Audio device: Intel Corporation 82801I (ICH9 Family) HD Audio Controller (rev 03)
00:1c.0 PCI bridge: Intel Corporation 82801I (ICH9 Family) PCI Express Port 1 (rev 03)
00:1c.1 PCI bridge: Intel Corporation 82801I (ICH9 Family) PCI Express Port 2 (rev 03)
00:1c.2 PCI bridge: Intel Corporation 82801I (ICH9 Family) PCI Express Port 3 (rev 03)
00:1c.3 PCI bridge: Intel Corporation 82801I (ICH9 Family) PCI Express Port 4 (rev 03)
00:1d.0 USB Controller: Intel Corporation 82801I (ICH9 Family) USB UHCI Controller #1 (rev 03)
00:1d.1 USB Controller: Intel Corporation 82801I (ICH9 Family) USB UHCI Controller #2 (rev 03)
00:1d.2 USB Controller: Intel Corporation 82801I (ICH9 Family) USB UHCI Controller #3 (rev 03)
00:1d.7 USB Controller: Intel Corporation 82801I (ICH9 Family) USB2 EHCI Controller #1 (rev 03)
00:1e.0 PCI bridge: Intel Corporation 82801 Mobile PCI Bridge (rev 93)
00:1f.0 ISA bridge: Intel Corporation ICH9M-E LPC Interface Controller (rev 03)
00:1f.2 SATA controller: Intel Corporation ICH9M/M-E SATA AHCI Controller (rev 03)
00:1f.3 SMBus: Intel Corporation 82801I (ICH9 Family) SMBus Controller (rev 03)
01:00.0 VGA compatible controller: nVidia Corporation G98M [Quadro NVS 160M] (rev a1)
03:01.0 CardBus bridge: Ricoh Co Ltd RL5c476 II (rev ba)
03:01.1 FireWire (IEEE 1394): Ricoh Co Ltd R5C832 IEEE 1394 Controller (rev 04)
03:01.2 SD Host controller: Ricoh Co Ltd R5C822 SD/SDIO/MMC/MS/MSPro Host Adapter (rev 21)
03:01.3 System peripheral: Ricoh Co Ltd R5C843 MMC Host Controller (rev 11)
0c:00.0 Network controller: Intel Corporation Wireless WiFi Link 5100


Ich bin kein Experte bzgl. Hardware, dennoch würde ich tippen es hängt nicht so sehr am X-Server. Ich gehe mal davon aus, dass der I/O Error bei /dev/nvidia0 der Knackpunkt ist. Denn der lässt sich so ähnlich auch mit einem cat /dev/nvidia0 reproduzieren.

Dieser Beitrag wurde bereits 2 mal editiert, zuletzt von »curmudgeon« (11.02.2011, 16:58)


6

11.02.2011, 16:57

Dann poste mal

Quellcode

1
 ls -l /dev/nvidia*
Eventuell stimmt mit dem Device-Node was nicht.
Auch wenn Open-Source kostenlos ist, ist sie nicht umsonst. Dein Preis ist Dein Engagement und Mitarbeit an OS-Projekten.
Wenn Du keinen Preis bezahlen willst, bist Du die Ware. Und das ist nicht Open Source, geschweigedenn frei.

7

11.02.2011, 17:10

Dann poste mal

Quellcode

1
 ls -l /dev/nvidia*
Eventuell stimmt mit dem Device-Node was nicht.
Ergebnis:

crw-rw---- 1 root video 195, 0 11. Feb 17:05 /dev/nvidia0

crw-rw---- 1 root video 195, 255 11. Feb 17:05 /dev/nvidiactl


root ist auch in der Video Gruppe, hab ich geprüft.

8

11.02.2011, 18:31

Hmm..., ich denke der eigentliche Fehler fängt mit folgenden an:

Zitat von »curmudgeon Xorg Log«

Quellcode

1
2
3
4
5
[   170.344] (EE) NVIDIA(0): Failed to initialize the NVIDIA GPU at PCI:1:0:0.  Please
[   170.344] (EE) NVIDIA(0):     check your system's kernel log for additional error
[   170.344] (EE) NVIDIA(0):     messages and refer to Chapter 8: Common Problems in the
[   170.344] (EE) NVIDIA(0):     README for additional information.
[   170.344] (EE) NVIDIA(0): Failed to initialize the NVIDIA graphics device!
Sprich der Treiber kann nicht auf den Bus (das Device) zugreifen.
Das könnte evtl. auch an der Kernel Konfiguration liegen. Hättest du noch einen anderen Kernel parat mit dem man das mal testen könnte?
(würde eine aktuelle Live mit X und Desktop mit dieser Hardware funktionieren?)

9

11.02.2011, 18:55

Ich habe noch einen Genkernel-Kernel, hier will er das Modul auch nach einem re-emerge der nvidia-drivers das modul nvidia nicht laden (Fatal: Error inserting .... Invalid Module Format).
Der Nouveau Treiber funktioniert übrigens, nur ist der was z.B. komplexere Desktop-Effekte angeht nicht performant genug.

EDIT:
Auf diesem Laptop hab ich vor ca. einem Jahr schon Gentoo installiert und damals kam er mit den nvidia-drivers klar.
Ich werde mal nach einer Distribution mit aktuellen Nvidia-Treibern suchen.

10

11.02.2011, 19:02

Hast Du bei Deinem anderen Kernel auch das Nvidia Modul neu bauen lassen?

Nach jeder Änderung des Kernels muss nvidia neu emerged werden und das auf den richtig gelinkten kernel.

Zitat

eselect kernel list

Muss der * bei dem aktuell laufenden Kernel sein und dann nvidia neu emergen.

Viele Grüße
Alienware 17 R3 16 GB RAM
NVIDIA GTX970 Optimus
Intel Corporation Wireless 8260 AC
Blu-ray Disc ROM & DVD+/-RW
Ubuntu Gnome Desktop
+
Samsung Aktivbook 8, 16 GB DDR3-1666, 2000 GIG SATA
ATI Radeon HD 8870M
Intel Corporation Centrino Advanced-N 6235
Blu-ray Disc ROM & DVD+/-RW
Xbuntu mit debootstrap
+
Intel Core 2 Duo
2 GB MB RAM
ca. 3,5 TB SATA
TBS6980 Dual DVB S2
YaVDR amd64 + VDR1.7.x + XBMC + VDPAU


Mein Overlay:

Quellcode

1
layman -a amielke-overlay

11

11.02.2011, 19:05

Jep, hab ich gemacht - bis vor 3 Stunden hatte ich sogar nur ein Paket Sourcen drauf, da die Installation keine Woche alt ist ;)
Auch an das Switchen via

Quellcode

1
eselect opengl set nvidia
hab ich gedacht, in der /etc/modprobe.d/blacklist.conf ist nouveau auf blacklist gesetzt und nvidia nicht.

12

11.02.2011, 19:29

Hast Du in der Kernel Config Anpassungen gemacht?

Wichtig ist das du kein Nvidia Framebuffer aktiviert hast. Sonnst geht der Nvidia Treiber auch nicht.
Alienware 17 R3 16 GB RAM
NVIDIA GTX970 Optimus
Intel Corporation Wireless 8260 AC
Blu-ray Disc ROM & DVD+/-RW
Ubuntu Gnome Desktop
+
Samsung Aktivbook 8, 16 GB DDR3-1666, 2000 GIG SATA
ATI Radeon HD 8870M
Intel Corporation Centrino Advanced-N 6235
Blu-ray Disc ROM & DVD+/-RW
Xbuntu mit debootstrap
+
Intel Core 2 Duo
2 GB MB RAM
ca. 3,5 TB SATA
TBS6980 Dual DVB S2
YaVDR amd64 + VDR1.7.x + XBMC + VDPAU


Mein Overlay:

Quellcode

1
layman -a amielke-overlay

13

11.02.2011, 19:33

Stimmt, darum funktioniert der genkernel-Kernel nicht, das ist gut möglich.
Meinen Main-Kernel hab ich entsprechend angepasst und ohne acpi läuft der nvidia Treiber auch anstandslos.

14

12.02.2011, 17:58

Für alle anderen Suchende, Ich habe Fedora 14 64bit installiert, hier funktionieren die NVIDIA Treiber. An der Hardware kanns also nicht liegen, sobald ich Zeit habe, probiere ich mit dem Kernel Gentoo aus.

15

12.02.2011, 20:18

Da ich das mit dem Fedora/Gentoo Mashup Kernel nicht zeitig genug hinbekommen habe, hab ich eben Fedora 14 i686 getestet und siehe da:

Input/Output Error.

Mal an die Erfahreneren unter euch: Kann ich also davon ausgehen, dass einfach der aktuelle x86-Treiber auf meiner Hardware nicht funktioniert?

16

12.02.2011, 20:44

Lt. www.nvidia.com läuft Deine Karte mit allen Nvidia-Treibern ab 100.14.23. Daran sollte es also nicht liegen.
Wahrscheinlich hast Du was im Kernel, was da nicht rein gehört.
Poste mal die Ausgabe von "dmesg" als Anhang, so wie Deine /proc/config.gz
Auch wenn Open-Source kostenlos ist, ist sie nicht umsonst. Dein Preis ist Dein Engagement und Mitarbeit an OS-Projekten.
Wenn Du keinen Preis bezahlen willst, bist Du die Ware. Und das ist nicht Open Source, geschweigedenn frei.

17

13.02.2011, 10:08

Hier meine .config, die dmesg konnte ich hier nicht hochladen, da sie mit 60 kb (weniger alsl die config.txt) laut Forensoftware zu groß wäre.

Darum hier mal die interessanten Zeilen über "0000:01:00.0" der dmesg:

[ 0.284580] pci 0000:01:00.0: [10de:06eb] type 0 class 0x000300
[ 0.284596] pci 0000:01:00.0: reg 10: [mem 0xf5000000-0xf5ffffff]
[ 0.284612] pci 0000:01:00.0: reg 14: [mem 0xe0000000-0xefffffff 64bit pref]
[ 0.284628] pci 0000:01:00.0: reg 1c: [mem 0xf2000000-0xf3ffffff 64bit]
[ 0.284639] pci 0000:01:00.0: reg 24: [io 0xdf00-0xdf7f]
[ 0.284651] pci 0000:01:00.0: reg 30: [mem 0x00000000-0x0001ffff pref]
.........
[ 0.307272] vgaarb: device added: PCI:0000:01:00.0,decodes=io+mem,owns=io+mem,locks=none
[ 0.307287] vgaarb: loaded
.........
[ 0.414931] pci 0000:01:00.0: BAR 6: assigned [mem 0xf4000000-0xf401ffff pref]
.........
[ 0.426460] pci 0000:01:00.0: Boot video device
.........
[ 27.036827] nvidia 0000:01:00.0: PCI INT A -> GSI 16 (level, low) -> IRQ 16
[ 27.036842] nvidia 0000:01:00.0: setting latency timer to 64
[ 27.036847] vgaarb: device changed decodes: PCI:0000:01:00.0,olddecodes=io+mem,decodes=none:owns=io+mem
[ 27.036959] NVRM: loading NVIDIA UNIX x86 Kernel Module 260.19.36 Tue Jan 18 17:10:40 PST 2011
»curmudgeon« hat folgende Datei angehängt:
  • config.txt (67,11 kB - 4 mal heruntergeladen - zuletzt: 15.02.2011, 21:20)

18

13.02.2011, 12:01

Hier meine .config, die dmesg konnte ich hier nicht hochladen, da sie mit 60 kb (weniger alsl die config.txt) laut Forensoftware zu groß wäre.

Die Fehlermeldung könnte ein wenig irreführend sein..
Zu dieser kommt es zb auch wenn das Forum die Datei nicht lesen darf, daher stelle sicher das dein User lesend drauf zugreifen darf.
(zb ein "chmod 644 Datei") Dann sollte es eigentlich auch mit dem raufstellen hier ins Forum klappen.

PS: Nutze für Shell Ausgaben doch bitte auch die Code Tags hier im Forum, das ganze ist dann doch wesentlich besser lesbar.

19

13.02.2011, 12:41

Hier meine .config, die dmesg konnte ich hier nicht hochladen, da sie mit 60 kb (weniger alsl die config.txt) laut Forensoftware zu groß wäre.

Die Fehlermeldung könnte ein wenig irreführend sein..
Zu dieser kommt es zb auch wenn das Forum die Datei nicht lesen darf, daher stelle sicher das dein User lesend drauf zugreifen darf.
(zb ein "chmod 644 Datei") Dann sollte es eigentlich auch mit dem raufstellen hier ins Forum klappen.

PS: Nutze für Shell Ausgaben doch bitte auch die Code Tags hier im Forum, das ganze ist dann doch wesentlich besser lesbar.
Oh, das ist ein guter Punkt!

Die Code Tags haben bei mir vor ein paar Posts leider Probleme gemacht, es wurde alles ohne Zeilenumbruch in eine einzige Zeile gepresst.

20

13.02.2011, 13:00

Die Code Tags haben bei mir vor ein paar Posts leider Probleme gemacht, es wurde alles ohne Zeilenumbruch in eine einzige Zeile gepresst.

Wenn es ein Output aus einer Linux/UNIX Shell ist sollte es hier in den Code Tags eigentlich genau so (mitsamt den Zeilenumbrüchen) wiedergegeben werden wie es kopiert wurde.

PS Ich habs aber schon in einem deines letzten Post korrigiert.

...............................................................................................
Zum Topic

Du scheinst in deinem Kernel auch den Nouveau Treiber mit gesetzt zu haben, eventuell kommt es mit KMS und den nVidia Treiber zum Konflikt?
Schalte doch mal zum Test KMS via Kernelzeilen Parameter "nomodeset" ab, wie schaut es dann mit den nvidia Treiber bzw dem Start von X aus?