[Freedom server:] twee IPv6 DNS root servers onbereikbaar

Ik heb een RIPE Atlas probe aan mijn FRITZ!Box hangen.
Handig om te zien hoe gezond het interweb is :wink:

Ik zie al een hele tijd (weken, geen uren) dat er twee IPv6 DNS root servers onbereikbaar zijn vanaf het Freedom netwerk.

Ik heb geen idee waar dit zit, vermoedelijk ergens ā€˜upstreamā€™.

Het leek me niet serieus genoeg om een ticket in te schieten, maar misschien is er hier iemand die er iets mee kan.

Het gaat om a.root-servers.net en j.root-servers.net.

Op deze links kun je de actuele rapportage van RIPE zien voor de probes in het Freedom-netwerk.
klik en klik

Het verschil tussen dig en ping ontgaat me, ik dacht dat het gelijke resultaten zou moeten opleveren.

Maar dat doet er ook niet zoveel toe denk ik.

Op de links die ik gaf kan je zien dat er op het moment dat ik dit schrijf 15 probes actief zijn op het Freedom netwerk, en alle 15 kunnen ze de DNS servers in kwestie niet bereiken.

De probe die ik hier heb draait op een nanopi-neo-plus2, ik zou denken dat daar iets Linuxerigs op draait en dus dattie dig doet.
Maar RIPE heeft het over pingā€¦:confused:

Anyway, of het nou pingt of digt, het lijkt me niet goed dat de probes die servers niet kunnen bereiken.

[edit]
O wachtā€¦
RIPE zegt UDP Unreachable: 15, TCP Unreachable: 0
Kan je diggen met UDP?
(ik weet niks van Linux, behalve dat ik er vlekken van in mijn nek krijg :smile:)

Tracerouteā€¦
Dit is wat ā€˜mijnā€™ probe zegt voor a.root-servers.net


Latest Traceroute Result for Measurement #2009

2020-10-29 16:07 UTC

Traceroute to 2001:503:ba3e::2:30 (2001:503:ba3e::2:30), 40 byte packets
1 2a10:3781:436:1:2e3a:fdff:feeb:f3c5 AS206238 1.91ms 1.789ms 1.71ms
2 * * *
3 2a10:3780::1:1 AS206238 12.776ms 11.788ms 10.547ms
4 2a00:a7c0:20:1197:b::1 AS57866 11.836ms 10.493ms 10.295ms
5 2a00:a7c0:e20a:19::2 AS57866 11.698ms 11.192ms 11.032ms
6 2001:2000:3080:1184::1 adm-b1-link.telia.net AS1299 12.199ms * *
7 * * *
8 2001:2000:3018:13d::1 adm-b10-v6.telia.net AS1299 13.044ms 11.553ms *
9 * * *
10 * * *
11 * * *
12 * * *
13 * * *
255 * * *

Ik zie hier wel degelijk een IPv6 adres voor j.rootservers-net

Ik weet niet of ik nog veel kan toevoegen met mijn beperkte kennis van deze materie.

Het blijft m.i. opvallend dat alle 15 probes die gehost worden door Freedom-klanten dit verschijnsel zien.

Ik hoop eigenlijk dat een Freedom techneut dit oppikt, hoewel het probleem vermoedelijk niet bij Freedom ligt

Ik sluit me aan bij @anon49073608 over je analyse, top! :+1:

Het is vast wel verstandig als die partijen weten dat het ergens niet helemaal goed gaat, maar of wij dat moeten doen?
Ik beheers het jargon niet eens dat bij deze discipline hoort :grin:

Veel van de root servers zijn geen enkelvoudige systemen, maar hebben replicaā€™s die via anycast beschikbar zijn.
Dus niet iedereen hoeft hetzelfde beeld van het internet te hebben. Vanuit een ISP waarschijnlijk wel, maar golbaal gezien niet.

Hier is een artikel met iets meer achtergrond: ZDnet over anycast DNS of Cloudflare over anycast.

Het faal patroon doet mij denken aan het ontbreken van een retour route.

1 like

Zoals Noci ook al vermeldde, worden de root-servers niet in 1 locatie gehost, maar d.m.v. anycast zijn ze over de hele wereld verdeeld.
Het lijkt me goed om dit probleem bij Fusix aan te melden.

Je kan forceren dat dig IPv6 gebruikt door een -6 argument te gebruiken.

Ik zie vanuit mijn DSL verbinding hetzelfde probleem: twee root servers zijn niet bereikbaar.

Daarnaast heb ik het idee (maar geen harde gegevens) dat af en toe IPv6 connectiviteit minder is dan het zou moeten. Packet loss en servers die onbereikbaar zijn. Servers die via een andere Ipv6 verbinding gewoon bereikbaar blijken. IK zal de komende tijd eens wat metingen doen als ik tijd kan vinden.

Zowel A als J-root worden door Verisign beheert. Ik heb Verisign hier al meerdere keren over gemaild zonder ook maar een antwoord te krijgen. En zoals al eerder is opgemerkt wordt gebruik gemaakt van anycast. Wat het ook een best een naar geval maakt om op te lossen.

Kortom dit is een bekend probleem. Dat heel eerlijk gezegd ook niet een hoge prio heeft. Er zijn immers 11 andere root-DNS-servers over die prima over IPv6 te bereiken zijn.

Bovendien denk ik dat dit zichzelf gaat oplossen wanneer Freedom wat meer vet op de botten heeft en kan gaan peeren met wie weet Verisign.

1 like

zojuist hierover een ticket geopend.

Met mijn beperkte toegang ziet het er uit als een routeringsprobleem ergens op internet.
Ik zie vanuit mijn modem wel verkeer verstuurd worden naar A en J root-servers, maar nooit antwoord.

Vanuit het netwerk van mijn werkgever en van de partij waar ik een VPS heb kan ik ze wel bereiken, al zitten de subnets dan wel achter een ander AS (anycast netwerken)

Voor atlas bezitters in het Freedom netwerk lijkt het nadeel te zijn dat ze niet aan de benodigde 95% icmp replies komen voor de tags ā€œIPv6 Stable ā€¦dā€

Stability

These tags indicate a level of stability and reliability beyond that signified by the ā€œCapableā€ and ā€œWorksā€ tags (see above). In order for a probe to qualify for a Stable tag, it must have at least a 95% success rate for at least 95% of the time for the ICMP ping measurements that it performs. This means that occasional outages or connectivity problems are allowed so long as they are short and infrequent. The effects of widely unreliable or unreachable targets are controlled for by considering the success rate relative to measurements by other RIPE Atlas probes to the same targets.

Met dank aan @arien en de vrienden bij Fusix zijn de root-servers A en J weer bereikbaar.

Nu alleen nog 24h in spanning afwachten of mijn atlas probe ook de tag IPv6 Stable 1d krijgt.

4 likes

Als je hem netjes aan laat staan zal dat wel lukken :innocent:
Fijn dat de verbindingen met die rootservers weer tot leven gewekt zijn trouwens :ok_hand:

2 likes

Het lijkt er op dat a.root-servers.net weer onbereikbaar is vanaf het Freedom netwerk via UDP: klik

Mijn probe heeft zijn IPv6 Stable 1d labeltje al weer verloren, maar dat is logisch :cry:

Traceroute laat zien waar het misgaat.

$ traceroute6  a.root-servers.net
traceroute to a.root-servers.net (2001:503:ba3e::2:30), 30 hops max, 80 byte packets
 1  lo1.cmbr.nikhef-1.connected.by.freedom.nl (2a10:3780::226)  0.554 ms  0.605 ms  0.629 ms
 2  2a10:3780::2:1 (2a10:3780::2:1)  3.349 ms  3.320 ms  3.337 ms
 3  2a00:a7c0:20:1197:e::1 (2a00:a7c0:20:1197:e::1)  8.087 ms  8.113 ms  8.111 ms
 4  br0.eqxam6.nl.fusixnetworks.net (2a00:a7c0:e20a::6)  0.703 ms  0.684 ms  0.655 ms
 5  xe-0-0-17-0.a02.amstnl02.nl.bb.gin.ntt.net (2001:728:0:5000::106d)  1.281 ms  1.246 ms  1.216 ms
 6  ae-5.r24.amstnl02.nl.bb.gin.ntt.net (2001:728:0:2000::65)  0.924 ms  4.113 ms  0.916 ms
 7  ae-15.r20.londen12.uk.bb.gin.ntt.net (2001:728:0:2000::171)  6.388 ms  6.371 ms  6.352 ms
 8  ae-0.a02.londen12.uk.bb.gin.ntt.net (2001:728:0:2000::26a)  5.914 ms  5.876 ms  5.901 ms
 9  * * *
10  * * *
11  * * *
12  * * *
etc.

Op die a na doen ze het hier allemaal nog: klik

$ ping 2001:503:ba3e::2:30
PING 2001:503:ba3e::2:30(2001:503:ba3e::2:30) 56 data bytes
^C
--- 2001:503:ba3e::2:30 ping statistics ---
191 packets transmitted, 0 received, 100% packet loss, time 192194ms
$ mtr 2001:503:ba3e::2:30 
                                                                                          2021-02-22T13:16:06+0100
Keys:  Help   Display mode   Restart statistics   Order of fields   quit
                                                                                                                                                  Packets               Pings
 Host                                                                                                                                           Loss%   Snt   Last   Avg  Best  Wrst StDev
 1. xxxxxxxxxxxxxxxxxxxx                                                                                                                         0.0%     1    1.2   1.2   1.2   1.2   0.0
 2. lo1.cmbr.nikhef-1.connected.by.freedom.nl                                                                                                    0.0%     1    1.7   1.7   1.7   1.7   0.0
 3. 2a10:3780::2:1                                                                                                                               0.0%     1    2.0   2.0   2.0   2.0   0.0
 4. 2a00:a7c0:20:1197:e::1                                                                                                                       0.0%     1    1.9   1.9   1.9   1.9   0.0
 5. br0.eqxam6.nl.fusixnetworks.net                                                                                                              0.0%     1    1.9   1.9   1.9   1.9   0.0
 6. xe-0-0-17-0.a02.amstnl02.nl.bb.gin.ntt.net                                                                                                   0.0%     1    2.0   2.0   2.0   2.0   0.0
 7. ae-5.r24.amstnl02.nl.bb.gin.ntt.net                                                                                                          0.0%     1    2.8   2.8   2.8   2.8   0.0
 8. ae-15.r20.londen12.uk.bb.gin.ntt.net                                                                                                         0.0%     1    7.9   7.9   7.9   7.9   0.0
 9. ae-0.a02.londen12.uk.bb.gin.ntt.net                                                                                                          0.0%     1   12.9  12.9  12.9  12.9   0.0
10. (waiting for reply)

Geen antwoord.

Sinds gistermiddag is het lijntje naar j.root-servers.net ook weer stuk: klik
Je zou haast gaan denken dat iemand upstream een oude backup heeft teruggezet :astonished:

In een eerdere poging hielp het niet om NTT ipv Telia te gebruiken. Daarom verbaasde me dat het nu wel hielp.

Maar ja dit zijn zgn. anycast root-servers. Heel kort samengevat wil dat zeggen dat er meerdere servers hetzelfde IP-adres gebruiken. Deze servers staan op meerdere plekken in het internet. BGP maakt de keuze welke server de beste route geeft. Je hebt dus geen twee servers met elk een eigen IP-adres waar je even naar kunt kijken. Het gaat dus om tientallen servers met hetzelfde IP-adres en dat maakt het best lastig debuggen. Want als je door een BGP-beslissing ergens op een andere server terecht komt kan het ineens niet of wel weer werken.

Omdat A en J beide door Verisign worden beheerd, vermoed ik dat daar het probleem zit. Nu zit Freedom sinds kort aan de AMS-IX en Verisign zit daar ook. Ik heb ze een peering request gestuurd. De route over AMS-IX kan op zich wel helpen maar zo krijgen we mogelijk ook een ingang bij Verisign.

4 likes

Dank je, goed om te weten dat het nog steeds aandacht heeft en dat er aan gewerkt wordt :ok_hand:
Raar maar waar: j.root-servers.net doet het intussen weer, alleen a.root-servers.net is nog onbereikbaar.

Als het goed gaat mag het ook gezegd worden.

Ik zag net het volgende bericht in mijn RIPE Atlas account:

2021-09-20 05:25:09 UTC Probe auto-tagged Your probe #54300 was automatically tagged as ā€œsystem: IPv6 Stable 90dā€

Fijn, dank aan wie dan ook die dit voor elkaar gekregen heeft! :ok_hand:

3 likes