📰Today’s article
Title
AWS Restores Service After Massive Outage that Hit 1,000+ Apps
AWS、1,000以上のアプリに影響した大規模障害から復旧
Article
English | Japanese |
---|---|
Amazon Web Services said late Monday it had resolved a massive outage that took many leading websites offline for hours. More than 1,000 apps and sites, including Snapchat and banks like Lloyds and Halifax, were affected by problems Amazon said were central to US operations. Downdetector said user trouble reports worldwide soared to more than 11 million during Monday’s disruption. | Amazon Web Servicesは月曜遅く、数多くの主要サイトを数時間にわたりオフラインにした大規模な障害を解決したと述べた。SnapchatやLloyds、Halifaxのような銀行を含む1,000以上のアプリやサイトが、Amazonによれば米国の運用の中枢に関わる問題の影響を受けた。Downdetectorは、月曜日の障害の間に世界中のユーザーからの不具合報告が1,100万件を超えて急増したと述べた。 |
“What this episode has highlighted is just how interdependent our infrastructure is,” said Prof Alan Woodward of the University of Surrey. “So many online services rely upon third parties for their physical infrastructure, and this shows that problems can occur in even the largest of those third-party providers. “Small errors, often human made, can have widespread and significant impact.” | 「今回の出来事が浮き彫りにしたのは、私たちのインフラがいかに相互依存しているかという点だ」とサリー大学のAlan Woodward教授は述べた。「多くのオンラインサービスが物理的インフラを第三者に依存しており、最大手の第三者プロバイダーであっても問題が起こり得ることを示している。」「小さなエラーは、しばしば人為的なものだが、広範で重大な影響を及ぼし得る。」 |
Problems appeared around 07:00 BST Monday as users struggled to access many platforms. Services hit ranged from online games like Fortnite to apps like Duolingo. Downdetector said it saw over four million reports across 500 sites, later topping 11 million as Reddit and Lloyds Bank tried to recover. At around 2300 BST, Amazon said AWS had “returned to normal operations.” | 月曜の英国夏時間07:00ごろに問題が現れ、ユーザーは多くのプラットフォームにアクセスしづらくなった。被害を受けたサービスは、FortniteのようなオンラインゲームからDuolingoのようなアプリまで多岐にわたった。Downdetectorは、500のサイトで400万件超の報告を確認し、その後、RedditやLloyds Bankが復旧を試みる中で1,100万件に達したと述べた。英国夏時間2300ごろ、AmazonはAWSが「通常運用に戻った」と述べた。 |
A new series of “cascading failures” may have arisen after the initial outage, said Mike Chapple. “It’s like when you have a large-scale power outage. Crews start working to try to bring it back on line,” Mr Chapple said. “The power might flicker a few times,” but it’s possible Amazon had initially “only addressed the symptoms” and not the cause. | 初期の障害の後に、新たな「連鎖的な故障」の一連が生じた可能性があるとMike Chapple氏は述べた。「大規模な停電が起きたときのようなものだ。復旧のために作業員が立ち上げようとする」とChapple氏は述べた。「電力は数回ちらつくかもしれない」が、Amazonは当初、原因ではなく「症状にのみ対処した」可能性がある。 |
Amazon has not fully detailed the cause. Its status page said the issue “appears to be related to DNS resolution of the DynamoDB API endpoint in US-EAST-1”. Cloudflare’s Matthew Prince said, “Everyone has a bad day, today Amazon had a bad day.” Cori Crider called it “a bit like a bridge collapsing” and said the status quo was “unsustainable.” | Amazonは原因を完全には明らかにしていない。同社のステータスページは、この問題が「US-EAST-1におけるDynamoDB APIエンドポイントのDNS解決に関連しているように見える」と述べた。CloudflareのMatthew Prince氏は「誰にでも悪い日はある。今日はAmazonにとって悪い日だった」と述べた。Cori Crider氏はそれを「橋が崩落するのに少し似ている」と形容し、現状は「持続可能ではない」と述べた。 |
📘Vocabulary
- interdependent – adjective
- Meaning: connected so each part needs others to work.
- Example: Modern cities are interdependent, since transport, power, and hospitals rely on each other.
- 意味: 互いに依存し合っていて、各部分が他の部分を必要とする。
- 例文: 現代の都市は相互依存しており、交通や電力、病院は互いに支え合っている。
- rely on – phrasal verb
- Meaning: depend on someone or something for help or support.
- Example: Small startups often rely on cloud services to run their apps.
- 意味: 助けや支えを得るために人や物に頼る。
- 例文: 小規模な新興企業は、アプリを動かすのにクラウドサービスに頼ることが多い。
- widespread – adjective
- Meaning: existing or happening in many places or among many people.
- Example: A minor bug caused widespread outages across several popular apps.
- 意味: 多くの場所や多くの人々の間で起きている。
- 例文: 些細なバグが、いくつかの人気アプリで広範な障害を引き起こした。
- flicker – verb
- Meaning: to shine or appear for short, quick moments on and off.
- Example: During the restart, the service may flicker before it stabilizes.
- 意味: 短く素早く点いたり消えたりする/ちらつく。
- 例文: 再起動の最中は、安定する前にサービスがちらつくことがある。
- status quo – noun
- Meaning: the current situation that exists now.
- Example: Some engineers questioned whether the status quo was sustainable.
- 意味: 現状・今の状態。
- 例文: 一部のエンジニアは、その現状が持続可能かどうかを疑問視した。
📝Let’s summarize
Summary | 要約 |
---|---|
Amazon Web Services resolved a major outage that knocked more than 1,000 apps and sites offline, generating over 11 million trouble reports. Issues emerged around 07:00 BST and persisted as experts cited interdependence, cascading failures, and DNS problems in US-EAST-1. | Amazon Web Servicesは、1,000以上のアプリやサイトをオフラインにした重大な障害を解決し、1,100万件超の不具合報告が生じた。問題は英国夏時間07:00ごろに現れ、相互依存、連鎖的な故障、US-EAST-1のDNS問題が指摘された。 |
[Word Count: 40 words] |
❓Comprehension Questions
Q1: What did Amazon say about AWS at around 2300 BST?
A. Amazon said engineers were still investigating user reports across European data centers.
B. Amazon said it would publish a full timeline after internal review soon.
C. Amazon said AWS had returned to normal operations at around 2300 BST.
D. Amazon said most banks decided to shut down their mobile services that night.
問1: 英国夏時間2300頃、AmazonはAWSについて何と述べましたか。
Correct answer: C
正解選択肢: AmazonはAWSが英国夏時間2300頃に通常運用に戻ったと述べた。
該当文: At around 2300 BST, Amazon said AWS had “returned to normal operations.”
Q2: According to Downdetector, how many trouble reports were seen during the disruption?
A. Downdetector said it recorded exactly nine million issues across several regions today.
B. Downdetector said most users faced short delays but reported few outages overall.
C. Downdetector said one million reports came from about five hundred platforms worldwide.
D. Downdetector said trouble reports worldwide rose to more than eleven million Monday.
問2: Downdetectorによると、障害中にどれだけの不具合報告が見られましたか。
Correct answer: D
正解選択肢: Downdetectorは、世界中の不具合報告が1,100万件を超えたと述べた。
該当文: Downdetector said user trouble reports worldwide soared to more than 11 million during Monday’s disruption.
Q3: What did Amazon’s status page say the issue appeared related to?
A. The status page said the outage came from power failures in London facilities.
B. The status page said it appeared related to DNS resolution of a DynamoDB endpoint in US-EAST-1.
C. The status page said engineers discovered a security breach affecting customer passwords recently.
D. The status page said it was caused by heavy traffic from gaming platforms worldwide.
問3: Amazonのステータスページは、この問題が何に関連しているようだと述べましたか。
Correct answer: B
正解選択肢: その問題は、US-EAST-1のDynamoDBエンドポイントのDNS解決に関連しているようだと述べた。
該当文: Its status page said the issue “appears to be related to DNS resolution of the DynamoDB API endpoint in US-EAST-1”.
💬Today’s your thoughts
Question
Should companies reduce dependence on a single cloud provider to avoid large outages?
大規模な障害を避けるため、企業は単一のクラウドプロバイダーへの依存を減らすべきでしょうか。
Model Answer – 1(肯定的立場)
English | Japanese |
---|---|
I agree that companies should reduce reliance on a single cloud provider. | 私は、企業が単一のクラウドプロバイダーへの依存を減らすべきだと考える。 |
Firstly, relying on one provider concentrates risk, because a single fault can disable many systems. For example, when one service fails, sign-in, billing, and backups may all stop. This may disrupt operations and delay help for customers. | まず、1社に依存するとリスクが集中する。なぜなら、1つの故障で多数のシステムが止まり得るからだ。例えば、1つのサービスが停止すると、サインイン、課金、バックアップがすべて止まる可能性がある。これにより業務が乱れ、顧客への支援が遅れることがあり得る。 |
In addition, diversification improves recovery, because teams can shift workloads when trouble appears. For instance, a backup provider can handle logins while databases restart elsewhere. This can limit downtime, protect revenue, and give engineers breathing room to fix root causes. | さらに、多様化は復旧力を高める。トラブル時にチームがワークロードを移せるからだ。例えば、別プロバイダーがログインを処理し、その間に他所でデータベースを再起動できる。これによりダウンタイムを抑え、収益を守り、原因修正の余裕を与え得る。 |
Therefore, reducing dependence is prudent: it spreads risk, speeds recovery, and supports customers. Companies should plan, test, and budget for multi-cloud designs before the next outage surprises them. | したがって、依存度を下げるのは賢明だ。リスクを分散し、復旧を早め、顧客を支えるからである。次の障害に備え、企業はマルチクラウド設計を計画・検証し、予算化しておくべきだ。 |
[Word Count: 117 words] |
Model Answer – 2(否定的立場)
English | Japanese |
---|---|
I disagree that every company must reduce reliance on a single provider. | すべての企業が単一プロバイダーへの依存を減らさねばならない、とは私は思わない。 |
To begin with, multi-cloud increases complexity, because teams must learn, secure, and monitor different systems. For example, two cloud setups can double network rules and dashboards. This can slow projects, create configuration drift, and raise costs without clear gains. | まず、マルチクラウドは複雑性を高める。異なるシステムを学習・保護・監視しなければならないからだ。例えば、2つのクラウド構成はネットワーク規則やダッシュボードを倍増させ得る。これによりプロジェクトが遅れ、設定のばらつきが生じ、明確な利得なくコストが増え得る。 |
Moreover, one well-architected platform may deliver strong reliability, because designs can add regional backups and careful rollouts. For instance, disciplined testing and gradual releases can prevent widespread impact. This can keep focus, reduce waste, and still achieve fast, stable recovery. | さらに、適切に設計された単一の基盤でも高い信頼性は得られる。地域冗長や慎重なロールアウトを設計に加えられるからだ。例えば、規律あるテストと段階的リリースは広範な影響を防ぎ得る。これにより集中を保ち、無駄を減らしつつ、迅速で安定した復旧を達成し得る。 |
Consequently, companies should decide case by case: simplify first, improve architecture, and measure results. If risks remain high, they can add providers later without rushing into costly, hard-to-manage complexity. | その結果、企業は事例ごとに判断すべきだ。まずは単純化し、設計を改善し、成果を測ることだ。なおリスクが高ければ、管理が難しく高コストな複雑性に急いで踏み込まず、後からプロバイダーを追加すればよい。 |
[Word Count: 120 words] |
News Source: BBC News
https://www.bbc.com/news/articles/c20pgp3nx07o