Sie sind nicht angemeldet.

Lieber Besucher, herzlich willkommen bei: GentooForum.de. Falls dies Ihr erster Besuch auf dieser Seite ist, lesen Sie sich bitte die Hilfe durch. Dort wird Ihnen die Bedienung dieser Seite näher erläutert. Darüber hinaus sollten Sie sich registrieren, um alle Funktionen dieser Seite nutzen zu können. Benutzen Sie das Registrierungsformular, um sich zu registrieren oder informieren Sie sich ausführlich über den Registrierungsvorgang. Falls Sie sich bereits zu einem früheren Zeitpunkt registriert haben, können Sie sich hier anmelden.

1

06.09.2013, 10:13

Kernel Fehler und reboot unmöglich

Hallo zusammen,

ich habe jetzt schon über mehrere Monate immer wieder Kernel Fehler im Log. Sobald dieser Fehler auftritt ist ein reboot unmöglich und der Server wird bei einem reboot Versuch unbenutzbar. Es muss dann ein Hardreset gemacht werden.
Leider werde ich nicht ganz schlau aus dem Fehler.

Hier erstmal der Auszug aus dem Log:

Quellcode

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
Sep  5 22:32:20 linux kernel: lowmem_reserve[]: 0 3218 3921 3921
Sep  5 22:32:20 linux kernel: DMA32 free:5172kB min:6560kB low:8200kB high:9840kB active_anon:811964kB inactive_anon:162844kB active_file:1181208kB inactive_file:1024736kB unevictable:0kB isolated(anon):0kB isolated(file):0kB present:3374412kB managed:3295696kB mlocked:0kB dirty:55708kB writeback:21008kB mapped:56324kB shmem:66744kB slab_reclaimable:44884kB slab_unreclaimable:20328kB kernel_stack:2768kB pagetables:29664kB unstable:0kB bounce:0kB free_cma:0kB writeback_tmp:0kB pages_scanned:2 all_unreclaimable? no
Sep  5 22:32:20 linux kernel: lowmem_reserve[]: 0 0 703 703
Sep  5 22:32:20 linux kernel: Normal free:520kB min:1432kB low:1788kB high:2148kB active_anon:19820kB inactive_anon:19888kB active_file:267120kB inactive_file:359412kB unevictable:0kB isolated(anon):0kB isolated(file):0kB present:786432kB managed:719896kB mlocked:0kB dirty:28676kB writeback:54280kB mapped:4460kB shmem:888kB slab_reclaimable:10908kB slab_unreclaimable:17344kB kernel_stack:1000kB pagetables:4128kB unstable:0kB bounce:0kB free_cma:0kB writeback_tmp:0kB pages_scanned:126 all_unreclaimable? no
Sep  5 22:32:20 linux kernel: lowmem_reserve[]: 0 0 0 0
Sep  5 22:32:20 linux kernel: DMA: 1*4kB (E) 2*8kB (EM) 1*16kB (M) 3*32kB (UEM) 1*64kB (E) 3*128kB (UEM) 3*256kB (UEM) 2*512kB (EM) 3*1024kB (UEM) 3*2048kB (UEM) 1*4096kB (R) = 15684kB
Sep  5 22:32:20 linux kernel: DMA32: 727*4kB (UE) 226*8kB (UER) 10*16kB (MR) 0*32kB 0*64kB 0*128kB 0*256kB 0*512kB 0*1024kB 0*2048kB 0*4096kB = 4876kB
Sep  5 22:32:20 linux kernel: Normal: 130*4kB (U) 0*8kB 0*16kB 0*32kB 0*64kB 0*128kB 0*256kB 0*512kB 0*1024kB 0*2048kB 0*4096kB = 520kB
Sep  5 22:32:20 linux kernel: 744254 total pagecache pages
Sep  5 22:32:20 linux kernel: 19161 pages in swap cache
Sep  5 22:32:20 linux kernel: Swap cache stats: add 211950, delete 192789, find 48556/53472
Sep  5 22:32:20 linux kernel: Free swap  = 3405692kB
Sep  5 22:32:20 linux kernel: Total swap = 4028400kB
Sep  5 22:32:20 linux kernel: swapper/3: page allocation failure: order:0, mode:0x20
Sep  5 22:32:20 linux kernel: CPU: 3 PID: 0 Comm: swapper/3 Not tainted 3.10.7-gentoo #4
Sep  5 22:32:20 linux kernel: Hardware name:                  /D525MW, BIOS MWPNT10N.86A.0069.2010.0913.1432 09/13/2010
Sep  5 22:32:20 linux kernel: 0000000000000000 ffff88012fd83b98 ffffffff8148d831 ffff88012fd83c28
Sep  5 22:32:20 linux kernel: ffffffff81096155 ffffffff00000002 ffffffff81654078 0000000000000010
Sep  5 22:32:20 linux kernel: 0000000000000001 ffffffff00000030 0000000000000000 0000002000000000
Sep  5 22:32:20 linux kernel: Call Trace:
Sep  5 22:32:21 linux kernel: <IRQ>  [<ffffffff8148d831>] dump_stack+0x19/0x1b
Sep  5 22:32:21 linux kernel: [<ffffffff81096155>] warn_alloc_failed+0x111/0x126
Sep  5 22:32:21 linux kernel: [<ffffffff8104c702>] ? __wake_up_common+0x48/0x7e
Sep  5 22:32:21 linux kernel: [<ffffffff810988e4>] __alloc_pages_nodemask+0x73f/0x79d
Sep  5 22:32:21 linux kernel: [<ffffffff810336d3>] ? irq_exit+0x85/0x87
Sep  5 22:32:21 linux kernel: [<ffffffff813f78b6>] __netdev_alloc_frag+0x5b/0x110
Sep  5 22:32:21 linux kernel: [<ffffffff813fa59c>] __netdev_alloc_skb+0x51/0xef
Sep  5 22:32:21 linux kernel: [<ffffffff8130c344>] ? swiotlb_tbl_sync_single+0x59/0x66
Sep  5 22:32:21 linux kernel: [<ffffffffa0025bef>] rtl8169_poll+0x221/0x4a2 [r8169]
Sep  5 22:32:21 linux kernel: [<ffffffff81401fe3>] net_rx_action+0x6a/0x13f
Sep  5 22:32:21 linux kernel: [<ffffffff81033500>] __do_softirq+0xb6/0x170
Sep  5 22:32:21 linux kernel: [<ffffffff8103368e>] irq_exit+0x40/0x87
Sep  5 22:32:21 linux kernel: [<ffffffff81003c2e>] do_IRQ+0x98/0xaf
Sep  5 22:32:21 linux kernel: [<ffffffff814915ea>] common_interrupt+0x6a/0x6a
Sep  5 22:32:21 linux kernel: <EOI>  [<ffffffff810091b6>] ? default_idle+0x6/0x8
Sep  5 22:32:21 linux kernel: [<ffffffff810097bf>] arch_cpu_idle+0x13/0x18
Sep  5 22:32:21 linux kernel: [<ffffffff8105ca79>] cpu_startup_entry+0xa6/0x101
Sep  5 22:32:21 linux kernel: [<ffffffff81485258>] start_secondary+0x1ab/0x1af
Sep  5 22:32:21 linux kernel: Mem-Info:
Sep  5 22:32:21 linux kernel: DMA per-cpu:
Sep  5 22:32:21 linux kernel: CPU    0: hi:    0, btch:   1 usd:   0
Sep  5 22:32:21 linux kernel: CPU    1: hi:    0, btch:   1 usd:   0
Sep  5 22:32:21 linux kernel: CPU    2: hi:    0, btch:   1 usd:   0
Sep  5 22:32:21 linux kernel: CPU    3: hi:    0, btch:   1 usd:   0
Sep  5 22:32:21 linux kernel: DMA32 per-cpu:
Sep  5 22:32:21 linux kernel: CPU    0: hi:  186, btch:  31 usd: 111
Sep  5 22:32:21 linux kernel: CPU    1: hi:  186, btch:  31 usd:  38
Sep  5 22:32:21 linux kernel: CPU    2: hi:  186, btch:  31 usd: 120
Sep  5 22:32:21 linux kernel: CPU    3: hi:  186, btch:  31 usd:  52
Sep  5 22:32:21 linux kernel: Normal per-cpu:
Sep  5 22:32:21 linux kernel: CPU    0: hi:  186, btch:  31 usd:  68
Sep  5 22:32:21 linux kernel: CPU    1: hi:  186, btch:  31 usd:  14
Sep  5 22:32:21 linux kernel: CPU    2: hi:  186, btch:  31 usd:  88
Sep  5 22:32:21 linux kernel: CPU    3: hi:  186, btch:  31 usd:  51
Sep  5 22:32:21 linux kernel: active_anon:207946 inactive_anon:45683 isolated_anon:0
Sep  5 22:32:21 linux kernel: active_file:362082 inactive_file:346054 isolated_file:0
Sep  5 22:32:21 linux kernel: unevictable:0 dirty:21100 writeback:18827 unstable:0
Sep  5 22:32:21 linux kernel: free:5346 slab_reclaimable:13953 slab_unreclaimable:9418
Sep  5 22:32:21 linux kernel: mapped:15196 shmem:16908 pagetables:8448 bounce:0
Sep  5 22:32:21 linux kernel: free_cma:0
Sep  5 22:32:21 linux kernel: DMA free:15692kB min:28kB low:32kB high:40kB active_anon:0kB inactive_anon:0kB active_file:0kB inactive_file:68kB unevictable:0kB isolated(anon):0kB isolated(file):0kB present:15984kB managed:15900kB mlocked:0kB dirty:16kB writeback:20kB mapped:0kB shmem:0kB slab_reclaimable:20kB slab_unreclaimable:0kB kernel_stack:0kB pagetables:0kB unstable:0kB bounce:0kB free_cma:0kB writeback_tmp:0kB pages_scanned:0 all_unreclaimable? no



Für mich gibt es nun viele Möglichkeiten der Ursache.

1. Es könnte ein ein Festplattenproblem bzw. Controllerproblem sein. Deshalb die Fehlermeldung vom swapper und das ganze DMA Zeug.
Ich betreibe ein Software-RAID im RAID 1 Verbund mit 2 identischen Platten und mdadm.

Quellcode

1
Sep  5 22:32:20 linux kernel: swapper/3: page allocation failure: order:0, mode:0x20



2. Es ist die Netzwerkkarte worauf der Call Trace schließen lässt. rtl8169 ist meine Netzwerkkarte. IRQ bzw. BIOS Problem?

Quellcode

1
2
3
4
5
Sep  5 22:32:21 linux kernel: [] __netdev_alloc_frag+0x5b/0x110
Sep  5 22:32:21 linux kernel: [] __netdev_alloc_skb+0x51/0xef
Sep  5 22:32:21 linux kernel: [] ? swiotlb_tbl_sync_single+0x59/0x66
Sep  5 22:32:21 linux kernel: [] rtl8169_poll+0x221/0x4a2 [r8169]
Sep  5 22:32:21 linux kernel: [] net_rx_action+0x6a/0x13f



Hier noch die lscpi Ausgabe:

Quellcode

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
00:00.0 Host bridge: Intel Corporation Atom Processor D4xx/D5xx/N4xx/N5xx DMI Bridge (rev 02)
00:02.0 VGA compatible controller: Intel Corporation Atom Processor D4xx/D5xx/N4xx/N5xx Integrated Graphics Controller (rev 02)
00:1b.0 Audio device: Intel Corporation NM10/ICH7 Family High Definition Audio Controller (rev 01)
00:1c.0 PCI bridge: Intel Corporation NM10/ICH7 Family PCI Express Port 1 (rev 01)
00:1c.1 PCI bridge: Intel Corporation NM10/ICH7 Family PCI Express Port 2 (rev 01)
00:1c.2 PCI bridge: Intel Corporation NM10/ICH7 Family PCI Express Port 3 (rev 01)
00:1c.3 PCI bridge: Intel Corporation NM10/ICH7 Family PCI Express Port 4 (rev 01)
00:1d.0 USB controller: Intel Corporation NM10/ICH7 Family USB UHCI Controller #1 (rev 01)
00:1d.1 USB controller: Intel Corporation NM10/ICH7 Family USB UHCI Controller #2 (rev 01)
00:1d.2 USB controller: Intel Corporation NM10/ICH7 Family USB UHCI Controller #3 (rev 01)
00:1d.3 USB controller: Intel Corporation NM10/ICH7 Family USB UHCI Controller #4 (rev 01)
00:1d.7 USB controller: Intel Corporation NM10/ICH7 Family USB2 EHCI Controller (rev 01)
00:1e.0 PCI bridge: Intel Corporation 82801 Mobile PCI Bridge (rev e1)
00:1f.0 ISA bridge: Intel Corporation NM10 Family LPC Controller (rev 01)
00:1f.2 IDE interface: Intel Corporation NM10/ICH7 Family SATA Controller [IDE mode] (rev 01)
00:1f.3 SMBus: Intel Corporation NM10/ICH7 Family SMBus Controller (rev 01)
01:00.0 Ethernet controller: Realtek Semiconductor Co., Ltd. RTL8111/8168 PCI Express Gigabit Ethernet controller (rev 06)



Beim booten habe ich noch 2 Sachen im Log, welche ich merkwürdig finde.

1. Die ACPI Fehler und der Timeout vom i915 gmbus panel.


Quellcode

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
Sep  5 20:12:52 linux kernel: ACPI Exception: AE_NOT_FOUND, Evaluating _PSS (20130328/processor_perflib-376)
Sep  5 20:12:52 linux kernel: ACPI Exception: AE_NOT_FOUND, Evaluating _PSS (20130328/processor_perflib-376)
Sep  5 20:12:52 linux kernel: ACPI Exception: AE_NOT_FOUND, Evaluating _PSS (20130328/processor_perflib-376)
Sep  5 20:12:52 linux kernel: ACPI Exception: AE_NOT_FOUND, Evaluating _PSS (20130328/processor_perflib-376)
Sep  5 20:12:52 linux kernel: microcode: CPU0 sig=0x106ca, pf=0x8, revision=0x107
Sep  5 20:12:52 linux kernel: ppdev: user-space parallel port driver
Sep  5 20:12:52 linux kernel: microcode: CPU1 sig=0x106ca, pf=0x8, revision=0x107
Sep  5 20:12:52 linux kernel: microcode: CPU2 sig=0x106ca, pf=0x8, revision=0x107
Sep  5 20:12:52 linux kernel: microcode: CPU3 sig=0x106ca, pf=0x8, revision=0x107
Sep  5 20:12:52 linux kernel: microcode: Microcode Update Driver: v2.00 <tigran@aivazian.fsnet.co.uk>, Peter Oruba
Sep  5 20:12:52 linux kernel: ACPI Exception: AE_NOT_FOUND, Evaluating _PSS (20130328/processor_perflib-376)
Sep  5 20:12:52 linux kernel: ACPI Exception: AE_NOT_FOUND, Evaluating _PSS (20130328/processor_perflib-376)
Sep  5 20:12:52 linux kernel: ACPI Exception: AE_NOT_FOUND, Evaluating _PSS (20130328/processor_perflib-376)
Sep  5 20:12:52 linux kernel: ACPI Exception: AE_NOT_FOUND, Evaluating _PSS (20130328/processor_perflib-376)
Sep  5 20:12:52 linux kernel[15959]: renamed network interface eth0 to enp1s0
Sep  5 20:12:52 linux kernel: ACPI Exception: AE_NOT_FOUND, Evaluating _PSS (20130328/processor_perflib-376)
Sep  5 20:12:52 linux kernel: ACPI Exception: AE_NOT_FOUND, Evaluating _PSS (20130328/processor_perflib-376)
Sep  5 20:12:52 linux kernel: ACPI Exception: AE_NOT_FOUND, Evaluating _PSS (20130328/processor_perflib-376)
Sep  5 20:12:52 linux kernel: ACPI Exception: AE_NOT_FOUND, Evaluating _PSS (20130328/processor_perflib-376)
Sep  5 20:12:52 linux kernel: [drm] Memory usable by graphics device = 512M
Sep  5 20:12:52 linux kernel: [drm] Supports vblank timestamp caching Rev 1 (10.10.2010).
Sep  5 20:12:52 linux kernel: [drm] Driver supports precise vblank timestamp query.
Sep  5 20:12:52 linux kernel: vgaarb: device changed decodes: PCI:0000:00:02.0,olddecodes=io+mem,decodes=io+mem:owns=io+mem
Sep  5 20:12:52 linux kernel: [drm] GMBUS [i915 gmbus panel] timed out, falling back to bit banging on pin 3
Sep  5 20:12:52 linux kernel: [drm] initialized overlay support
Sep  5 20:12:52 linux kernel: fbcon: inteldrmfb (fb0) is primary device
Sep  5 20:12:52 linux kernel: i915: fixme: max PWM is zero
Sep  5 20:12:52 linux kernel: Console: switching to colour frame buffer device 160x50
Sep  5 20:12:52 linux kernel: i915 0000:00:02.0: fb0: inteldrmfb frame buffer device
Sep  5 20:12:52 linux kernel: i915 0000:00:02.0: registered panic notifier
Sep  5 20:12:52 linux kernel: i915: No ACPI video bus found
Sep  5 20:12:52 linux kernel: [drm] Initialized i915 1.6.0 20080730 for 0000:00:02.0 on minor 0



2. Der Firmware path für die rtl8169 konnte nicht geladen werden.

Quellcode

1
2
3
4
Sep  5 20:12:52 linux kernel: r8169 0000:01:00.0 enp1s0: unable to load firmware patch rtl_nic/rtl8168e-2.fw (-2)
Sep  5 20:12:52 linux kernel: r8169 0000:01:00.0 enp1s0: link down
Sep  5 20:12:52 linux kernel: r8169 0000:01:00.0 enp1s0: link down
Sep  5 20:12:54 linux kernel: r8169 0000:01:00.0 enp1s0: link up


Kernel ist:

Quellcode

1
Linux linux 3.10.7-gentoo #4 SMP Thu Sep 5 09:23:21 CEST 2013 x86_64 Intel(R) Atom(TM) CPU D525 @ 1.80GHz GenuineIntel GNU/Linux



Hat jemand eine Idee?

Danke schonmal

Wilson

Dieser Beitrag wurde bereits 1 mal editiert, zuletzt von »wilson.meier« (06.09.2013, 17:22)


2

06.09.2013, 19:00

Das kann jetzt natürlich mehrere Ursachen haben. Zum einen hast du viel zu wenig Ram. Der Server swapt ja voll. Ein Server soll nicht swapen. Das ist nur ein Notnagel. Wird geswapt muss mehr Ram rein.
Da du die gleiche Netzwerkkarte wie ich in meinem Desktop hast, hatte ich auch mal so ein Problem wie du. Wichtig ist nur den Treiber für deine Karte im Kernel einkompilieren, am besten fix (CONFIG_R8169) und sonst keine. da hier gern der falsche Treiber vom System verwendet wird. Bei mir ist bei den Netzwerkkartentreiber sonst überhaupt nichts angehakt. Und anscheinend fehlt dir das Firmewarepaket. Das benötigt man seit... ich glaub kernel 3.7 oder so. (sys-kernel/linux-firmware)
Schau mal ob das bei dir so passst.
Ich würde auch die Kernelconfig mal wieder genauer durchsehen. Mit dem Umstieg bei meinem Desktop von Kernel 3.8 auf 3.10 hatte ich auch gleich mal Kernelpanik. Da kam mit Oldconfig sehr viel Mist mitrein.

lg
boospy
Gentoo Can Do!

Wiki auf: http://deepdoc.at