Sie sind nicht angemeldet.

Lieber Besucher, herzlich willkommen bei: GentooForum.de. Falls dies Ihr erster Besuch auf dieser Seite ist, lesen Sie sich bitte die Hilfe durch. Dort wird Ihnen die Bedienung dieser Seite näher erläutert. Darüber hinaus sollten Sie sich registrieren, um alle Funktionen dieser Seite nutzen zu können. Benutzen Sie das Registrierungsformular, um sich zu registrieren oder informieren Sie sich ausführlich über den Registrierungsvorgang. Falls Sie sich bereits zu einem früheren Zeitpunkt registriert haben, können Sie sich hier anmelden.

1

02.07.2009, 11:20

[gelöst] unmotivierte Abstürze, Rechner friert ein

Lösung:
Nach einem Update der NVIDIA-Driver von 180.20 auf aktuell 180.60, mit self made Kernel 2.6.29-gentoo-r5 läuft die Kiste wieder rund. Die Ursache konnte nicht ermittelt werden. Offensichtlich gab es Probleme mit den NVIDIA-Drivers. Vielen Dank an alle.

---

Hallo Leute,

nach einem World-Update friert der Rechner mindestens einmal am Tag ein. Es funktioniert keine Maus, Tastatur und auch über Netzwerk ist der Rechner nicht mehr zu erreichen. Dann kann ich nur noch den Stecker ziehen. Leider finde ich keine aussagekräftigen Hinweise, die auf ein Problem hindeuten.
Wie kann ich das Problem eingrenzen? Liegt es am Kernel, ist der X-Server dafür verantwortlich oder liegt es an den nvidia Treibern. Vor ca. 2 Jahren hatte ich ähnliche Effekte. Durch ein Update der nvidia-Treiber glaubte ich das Problem gelöst zu haben. Daher würde ich zunächst die nvidia- Treiber untersuchen.

Zitat

Xorg.0.log:
(WW) The directory "/usr/share/fonts/TTF/" does not exist.
(WW) The directory "/usr/share/fonts/OTF" does not exist.
(WW) The directory "/usr/share/fonts/Type1/" does not exist.
(WW) Open ACPI failed (/var/run/acpid.socket) (No such file or directory)
(II) Loading extension MIT-SCREEN-SAVER
Wenn ich die nvidia-Treiber kompiliere finde ich im Log:

Zitat

make -C /lib/modules/2.6.29-gentoo-r5/build \
KBUILD_SRC=/usr/src/linux-2.6.29-gentoo-r5 \
KBUILD_EXTMOD="/var/tmp/portage/x11-drivers/nvidia-drivers-180.29/work/NVIDIA-Linux-x86_64-180.29-pkg2/usr/src/nv" -f /usr/src/linux-2.6.29-gentoo-r5/Makefile \
modules
test -e include/linux/autoconf.h -a -e include/config/auto.conf || ( \
echo; \
echo " ERROR: Kernel configuration is invalid."; \
echo " include/linux/autoconf.h or include/config/auto.conf are missing."; \
echo " Run 'make oldconfig && make prepare' on kernel src to fix it."; \
echo;
Was kann ich tun um das Problem einzugrenzen?

Mfg ennaT

Dieser Beitrag wurde bereits 1 mal editiert, zuletzt von »ennat« (05.08.2009, 23:37)


2

02.07.2009, 14:36

Hi

hm.., könnte es sich nicht vielleicht auch um ein Überhitzungs Problem handeln? , es war in den letzten Tagen ja doch recht warm..!?

Du solltest auch grundsätzlich versuchen den Rechner sauber herunterzufahren, ansonsten fängt man sich da schnell ein kaputtes Filesystem ein. Falls du es nicht kennst, es gibt da für solche Fälle auch den Magic SysRQ-Key
siehe hierzu zb http://www.pro-linux.de/news/2002/0019.html , oder auch in der Kernel Dokumentation

3

02.07.2009, 23:35

Hi Josef,

ich war gerade dabei eine Nachricht zu verfassen und Peng! Nix ging mehr. Ich habe gleich Magic-SysRQ ausprobiert - leider musste ich wieder den Stecker ziehen. Merte!
Termische Effekte können wir ausschliessen. Ich hatte den Rechner gerade mal 3Minuten an. Sonst vergeht schon etwas mehr Zeit. Diese seltsamen Abstürze fallen nach meinen Beobachtungen mit dem System-Update und dem upgrade auf X-Server 1.5 zusammen. Bis dahin lief die Kiste wie ein Uhrwerk. Was mich stutzig macht ist die warning vom X-Server

Zitat

(WW) Open ACPI failed (/var/run/acpid.socket)
und die warning des Compilers beim Baunen des Moduls

Zitat

" ERROR: Kernel configuration is invalid."
Hast du eine Idee? Gibt es sowas wie einen Watch-Dog der z.B. einen Prozess (PS) überwacht und den PS dann killt wenn kein Heartbeat mehr meßbar ist?

Mfg ennaT

4

03.07.2009, 06:02

hellasn ennaT,
kann es sein, dass du unlängst einen neuen Kernel gebaut hast?
Die Warnung mit dem oldconfig läßt mich das vermuten.
System:
i7 P2600 @ 3,4GHz
jabber: poedel@jabber.ccc.de

5

03.07.2009, 09:16

Hi Poedel,

ja es ist richtig, ich habe einen neuen Kernel gebaut. Vorher habe ich 'make oldconfig && make prepare' ausgeführt. Auch die Dateien 'autoconf.h' und auto.conf' sind vorhanden.

Gibt es einen Schalter um debug-infos auszugeben?

Danke, ennaT

6

03.07.2009, 10:10

Zeigt der Link /usr/src/linux auf das richtige Kernelverzeichnis?

Hast Du dann alle Kernelmodule neu gebaut?

Hatt sowas schon mal, da habe ich das System "neu gebaut":

Quellcode

1
2
emerge -e system
emerge -e world


eventuell reicht das sytem. Ist bei Probleme jedefnalls immer zu empfehlen! Ein emerge -e system braucht auf aktueller Hardware 2-3h ... (Wenn es nicht abstürzt)
Deshalb mach dieses doch bitte (also system und noch nicht world)
Meine Rechtschreibfehler sind gewollt und unterliegen dem Copyright des Verfassers, es sei denn, sie sind explizit unter die GPL gestellt .....

Außerdem sind sie ein Ausdruck der Persönlichkeit des Schreibers!

7

03.07.2009, 12:49

ich vermute nicht, dass man das System neubaun muß. Eher denke ich, dass beim Kernelbau was daneben ging.
ich deute mal, dass es kein Genkernel ist.
Solltest du die use.flag symlink gesetzt haben, wird der klassische Symlink /usr/src/linux auf die neu emergierten gentoo-source (´s) gesetzt.
Dann müßtest du die .config manuell aus dem alten Verzeichnis rausholen, was logischerweise nicht mehr /usr/src/linux ist.
Solltest du das nicht so gemacht haben, hole das bitte nach.
Den Symlink überprüfen kannst du mit

Quellcode

1
ls -l /usr/src

oder mit

Quellcode

1
eselect kernel list

Der zweite Befehl nummeriert die Quellen durch.
Sollte die Quelle nicht passend gesetzt sein kannst du das nachholen mit

Quellcode

1
eselect kernel set X

wobei X die vorher genannte Nummer ist.
Dann einmal neubacken:

Quellcode

1
2
3
4
cd /usr/src/linux
make oldconfig
make && make modules_install
cp arch/i386/boot/bzImage /boot/kernelname

das passend in die grub.conf eintragen - wenn nicht schon passiert oder nicht umbenannt.
Der Pfad bezieht sich auf einen Standardkernel - andere Architekturen analog ersetzen.
Somit hättest du auch alle Module wieder für den aktuellen Kernel ersetzt und vermutlich läuft es dann wieder geschmeidig.

hth poedel
System:
i7 P2600 @ 3,4GHz
jabber: poedel@jabber.ccc.de

8

03.07.2009, 16:09

Ja, es ist richtig, der Kernel ist selbstgebaut.
Nach einem update habe ich die '.config' in das neue SRC-VZ kopiert. Dann setzte ich den Sym-Lnk mit

Zitat

$ eselect kernel list
[1] linux-2.6.20-gentoo-r8
[2] linux-2.6.23-gentoo-r3
[3] linux-2.6.25-gentoo-r7
[4] linux-2.6.29-gentoo-r5 *

$ eselect kernel set 4
auf die aktuellen Sourcen. Der link zeigt also auf

Zitat

$ ls -ltr /usr/src/
total 16
rwxrwxrwx 1 root root 22 15. Jun 21:23 linux -> linux-2.6.29-gentoo-r5
...
Dann wird

Zitat

$ cd /usr/src/linux
$ make oldconfig && make prepare
$ make && make modules && make modules_install
ausgeführt. Anschliessend wird der Kernel installiert und der Rechner neugestartet. Zum Schluß habe ich die nvidia-driver emerged.
Heute habe ich die als deprecated gekennzeichneten Optionen:

Power management and ACPI options --->
ACPI (Advanced Configuration and Power Interface) Support --->
[*] Deprecated /proc/acpi files
[*] Deprecated power /proc/acpi directories
[*] Deprecated /proc/acpi/event support

aktiviert. Seither kann ich nur noch ein temporäres Einfieren beobachten. Ob das wirklich die Lösung ist, bezweifel ich. Im Xorg-Log finde ich dann

Zitat

(WW) Open ACPI failed (/var/run/acpid.socket) (No such file or directory)
(II) No APM support in BIOS or kernel
(II) NVIDIA(0): Setting mode "nvidia-auto-select"
(II) NVIDIA(0): ACPI: failed to connect to the ACPI event daemon; the daemon
(II) NVIDIA(0): may not be running or the "AcpidSocketPath" X
(II) NVIDIA(0): configuration option may not be set correctly. When the
(II) NVIDIA(0): ACPI event daemon is available, the NVIDIA X driver will
(II) NVIDIA(0): try to use it to receive ACPI event notifications. For
(II) NVIDIA(0): details, please see the "ConnectToAcpid" and
(II) NVIDIA(0): "AcpidSocketPath" X configuration options in Appendix B: X
(II) NVIDIA(0): Config Options in the README.
(II) USB Keyboard + 2P Hub: Device reopened after 1 attempts.
(II) USB Keyboard + 2P Hub: Device reopened after 1 attempts.
(II) A4Tech PS/2+USB Mouse: Device reopened after 1 attempts.
Was heißt den 'Device reopened after 1 attempts.' ?

Mfg ennT

9

03.07.2009, 16:10

Hm.., zunächst den Kernel samt der externen Module noch mal neu zu bauen kann eigentlich nicht schaden, die Log des nvidia-drivers ist völlig normal, dies sind nur Überprüfungen, wenns nicht passt wird abgebrochen, das ist doch aber nicht der Fall oder?
Wenn kernel neu machen noch nichts bringt, ja dann würde ich auch ein "emerge -e system" empfehlen, evtl. dann mauch noch ein world, wie schon von Wernieman empfohlen.

Ansonsten ist da zb in der /var/log/messages kein Hinweis zu finden?

Hmm.. ich hatte mal ähnliches (kernel panic im laufenden Betrieb) aufgrund eins schleichenden Defekt eines Ram-Speicher Moduls...

/edit
Auch solltest du dringend mal die Dateisysteme überprüfen (am besten von einer LiveCD oä) und gegebenenfalls reparieren, dein System wurde ja anscheint doch schon öfter unsauber beendet.
Ich hatte nach einem Stromausfall, drei tage später auch schon ähnliches erlebt, siehe hier

Viel Erfolg!

Dieser Beitrag wurde bereits 1 mal editiert, zuletzt von »josef.95« (03.07.2009, 16:29)


10

09.07.2009, 11:14

Leider konnte ich das Problem noch nicht lokalisieren. Ein emerge -e system | world brachte keine Verbesserung. Als nächstes werde ich die Dateisystem überprüfen, einem MEM-Check über Nacht laufen lassen und mal längere Zeit mit einer Live-CD unter X arbeiten.

In der /var/log/messages finde ich nur folgenden Hinweis bzügl. nvidia

Zitat

nvidia: module license 'NVIDIA' taints kernel.
ACPI: PCI Interrupt Link [APC6] enabled at IRQ 16
nvidia 0000:07:00.0: PCI INT A -> Link[APC6] -> GSI 16 (level, low) -> IRQ 16
nvidia 0000:07:00.0: setting latency timer to 64
NVRM: loading NVIDIA UNIX x86_64 Kernel Module 180.29 Wed Feb 4 23:39:47 PST 2009
...
IRQ 16/nvidia: IRQF_DISABLED is not guaranteed on shared IRQs
Noch eine Frage zu Magic-SysRQ. Die Tastenkombination alt+sysrw+b löst einen reboot aus. Aber wie kann ich auf eine Konsole wechseln? (alt+sysrw+r , alt+strg+F1 tut nix)

Mfg ennaT

Dieser Beitrag wurde bereits 1 mal editiert, zuletzt von »ennat« (09.07.2009, 11:22)


11

10.07.2009, 23:08

Hm... den Dateisystem Check hätte ich als erstes gemacht..
die Messages zu nVidia sind so alle ok

Zu den Magic-SysRQ Keys fand ich nach einer kurzen suche dies..
[Tipps & Tricks] Der Magic SysRQ-Key

Viel Erfolg