前提
2021年7月に実施されたG検定2021#2に合格しましたので対策等の振り返りです。
私自身は数年のITエンジニアとしての実務経験はありますが、業務でAI、機械学習を扱ったことはありません。
IT関連資格(AIとは無関係)は比較的積極的に取り組んでいる。
機械学習に関しては参考書を使用した独学でPythonによる実装を行った経験はあります。本ブログに上がっている内容がほぼ全てです。
実施対策としてはAI分野をしっかり理解というよりはまずは合格を目指す、という色合いが強めだと思います。
また、まだ若い試験なので有効な対策などはすぐに変わってくるかもしれません。普遍的な部分もあると思いますが、本ブログも含むブログなどを参照する場合はできるだけ新しい情報を取り入れた方がいいでしょう。
結果について
G検定の結果は受験後にメールで来ます。比較的新しい試験だからか、まだ日程が安定していないようです。
今回は16日後の8/2(月)11時頃に通知メールが来ました。
結果の通知時期は受験前のメールで案内があります。リマインドメールで通知時期が変更になったりしてたので、気になる場合は最新メールをチェックしておくとよいと思います。
■私の結果
■シラバス分野別得点率(小数点以下切り捨て)
1.人工知能とは.人工知能をめぐる動向.人工知能分野の問題:95%
2.機械学習の具体的手法:80%
3.ディープラーニングの概要:87%
4.ディープラーニングの手法:83%
5.ディープラーニングの社会実装に向けて:79%
6.数理・統計:50%
ツイッターでの合格報告を覗いた感じだと合格者平均からやや下ぐらいに結果なのかなと思います。
「6.数理・統計」の得点率が低いですが、確かにあんまりちゃんとした対策はしなかった気がします。ただうろ覚えですが、この分野は割合的には低かった気がします。
G検定全体の印象
試験の難易度に関しては出題内容、試験形式を踏まえると、個人的にはやや易しいぐらいの印象を受けました。
ある程度の準備をすれば比較的多くの方が合格レベルには達しそうですが、知識ゼロの無対策で他人が作ったチートシートと検索だけではなかなか合格は難しそうと言った感じです。
試験の時間制約については厳しめというのが多く見る意見で、私もそう感じました。
他の資格試験にも言えることですが、難易度の感じ方や勉強時間、対策方針などが受験者によってかなりバラつきがある印象を受けました。進化が早い分野の試験であるのと、(私が受けてきたIT系資格と比べると)受験者のバックグラウンドや(自宅受験のため)受験環境が様々であることが要因しているのではないかと個人的には思いました。
受験時のスタイルについては、チートシートを中心に活用したり、検索を中心に活用したり、真っ向勝負(チートシートや検索には特に触れていない)など様々なパターンがありそうです。ここについては後でもう一回触れます。
実施対策
対策全体の流れ
試験対策としては約一か月前に書籍を購入して、試験対策を開始しました。
最初の2~3週間ぐらいはゆっくりペースで一週間に数時間程度、直前の二週間では週に10時間強ぐらい対策を行ったと思います。
全体の流れとしては次のような感じで進めました。
①ネット上のまとまっているG検定用のまとめなどを見て出題範囲などを把握
②ほぼ①と並行でマンガ書籍を読み直す
③書籍の問題集を解き進める
④公式のシラバスベースの用語まとめ
⑤前日と当日の朝にweb模擬を解く
そんなにきつくはないぐらいのペースで進めましたが、最終的にはやろうと思ってたところまでやるには時間が足りませんでした。
大半は用語まとめに時間を費やしていたと思います。
書籍
■マンガでわかる! 人工知能 AIは人間に何をもたらすのか (Informatics&IDEA)
こちらはG検定対策用に購入したものではなく、以前機械学習をするにあたって購入したものを読み返しました。内容的にはマンガなのでざっくりとした内容については理解しやすい、簡単に読み切れるというところはあります。
一連のAIブームの流れについては、試験対策としても概ねの用語や流れについては把握できると思います。
概要を把握できる程度なので、機械学習やディープラーニングの理論の分野については深さ、広さともに足りません。初学者の場合はこの手の読みやすいマンガ形式のものを読んでおくのはありだと思います。
■最短突破 ディープラーニングG検定(ジェネラリスト) 問題集
本格的なG検定対策のためにはこちらの書籍を一冊のみ購入しました。なので他の書籍との比較は私にはできません。
レビューの評価が悪くなく、比較的新しい、また中身を実際に軽く見たときもそこまで違和感がなかったので書籍版を購入しました。
こちらは1周のみ解き、あとは用語まとめをやる際に解説を参照したりする活用を行いました。
解説はだいぶ丁寧に書かれていたと思います。ただ初学者の場合はそれでも理論的な部分の解説は読んでもなかなか理解が難しいところがあるかもしれません。
試験範囲の網羅性については、G検定はまだシラバスの改定が激しいところもあり、細かい用語などはやや網羅しきれていない感がありました。
また、問題の難易度については、本試験よりも問題集の方がやや高い印象を受けました。
用語まとめ
早い話がテスト中のチートシート(カンペ)です。ここはチートシートを使用する前提で話していきます。
作成したものは以下の記事です。
www.wantanblog.com
上記の記事は、公式のシラバスに記載されているキーワードをベースに次のブログ様をチートシートに使用させていただくことを前提に作成しました。なので、ブログ様の内容で十分だと思った部分は自身のブログには記載していません。
【資格試験対策】ディープラーニングG検定【キーワード・ポイントまとめ】 - ITとかCockatielとか
チートシートは紙や、ローカルファイルなども考えられますが、私はwebページ形式で使用しました。具体的に言うとはてなブログの下書きとして表示した状態で使用しました。形式については自分が引きやすいものであればよいと思います。
この用語まとめですが、ちょうどいい具合に仕上げるのがなかなか難しかったです。勉強自体に時間をしっかりとって覚えられない部分のみをまとめるなら比較的シンプルな形にまとまりそうなのでその方針がとれるならそれが良いと思います。
ほとんどなにも分からない状態からやろうとするとかなり時間がかかります。
ネット上の記事などから調べて引っ張ってくるだけなら時間は節約できますが、結局本番試験のときにそれを読み解く必要があるので本番試験での完成度を下げます。または調べたものをしっかり読み解いて自分の言葉でまとめ直すとなるとそれなりに時間がかかります。また、しっかりまとめようとするとその過程で結構頭に入るのでしっかりとまとめた部分は逆にカンペは不要になるというジレンマもあります。
やってみた感触はその辺のバランスが結構難しかったという印象です。
最終的に私の場合は、前半部分はそれなりに力を入れてまとめましたが、試験本番まで時間が足りなくなってきたので、後半は引用が多くなったり調べきれないキーワードが出たりするといなんとも中途半端なものが出来上がりました。
まぁそれでも作成の過程で学ぶことがあったり、本番試験で使用することもあったので意味はありました。
私のどの程度の粒度でまとめたのかはリンク先を見ていただければと思います。試験自体を何度か受験したり外部公開や他者への共有を意識しないとなかなか良いものはできないんじゃないかと思います。
しっかりまとまってるブログとかは凄い。
web模擬試験
界隈では有名なweb模擬を使用させていただきました。
メールアドレスを登録するとメールにリンクが載せられてくるので、そのリンクから使用することができます。
G検定(AIの検定)模擬テスト – Study-AI
まずは今回の私の使用方法を記述していきます。
■直前対策225題 無料版
こちらは本番試験の前日に一度だけ解きました。
解いた際には、知識の獲得よりも本番試験の雰囲気をつかむことを重視したので、カンペあり、時間制限ありの本番の条件と合わせて解きました。
どの模擬試験でもいいと思いますが、本番試験のその辺の感覚を掴んでおくことは重要だと思います。
知識、用意したもの、検索スピードなどによって戦略を考えた方が合格率は高くなるはずです。
■新シラバス対応 約100題
これは当日の午前に一度解きました。
その名の通り、本流の模擬試験では対応しきれていないシラバスで追加されたキーワード関連の問題を解くことができます。
一度の試験しか受けていないので精度などは評価することはできませんが、今回の試験だけで言えば自身の対策があまかった音声処理関連(音韻、フォルマント周波数、音素、メル尺度などなど)などのところは特に役に立ちました。
いずれにしてもかなり有用です。これが無料で提供しれくれるというのだから解かない手はないと思います。特に初受験の場合には、制限時間の観点で自身が想定している受験スタイルで問題ないか確認するのに活用すると良いと思いました。
また、再度試験を受ける場合や時間に余裕がある場合などには複数回解いて、キーワードとキーワードの関連を強く記憶して即答できる問題を増やし他の問題に使える時間を増やすことにも活用できるのではないかと感じました。
個人的な対策方法
全体方針
他の方のブログなど見た感じだと、G検定では受験時にいくつかの方針が分けられると思います。
・自身の知識だけを頼りに解答する
・Google検索を中心に活用し解答する
・チートシートを中心に活用し解答する
上から順に基本的な知識が必要になると思っています。
Google検索を中心に活用するのは、私は「時間が足りない派」です。個人的には分からないところを検索していてはとても時間が足りなかったと思います。検索結果が表示される→内容を見て該当する箇所を探す→必要なら内容を理解するのは現実的ではないと感じました。
現実的にはGoogle検索を活用すると言っても「自身の知識だけを頼りに解答する」とほぼ同じ知識レベルにあるのかもしれません。
カンペはほぼ活用できず検索を中心に活用したと言い切る方もいらっしゃるので、その辺は自分で実際にやってみて最適な方針を見定めるとよいと思います。
私は「チートシートを中心に活用し解答する」方針で受験を行いました。
実際の受験時の解答の流れは以下の通りでした。
・知識で解答を行う
・分からなければチートシートを活用する
・それでも分からない問題は捨てるか最後に検索を行うか判断する
チートシートを活用する場合のかなり一般的な方針にはなると思います。最後に検索を行う問題はキーワードが分かれば解答できそうな問題のみをチェックしていく程度にしました。チートシートを活用する場合は知識のみで解答するよりも時間ロスが大きいのであまり時間は残らないと思ったからです。私の場合は残り10分程度で一旦解答が完了しチェックを付けた問題に関連するキーワードの検索を行い、数問解答し直しました。
概要理解分野
チートシートを活用する方針の場合には知識的に覚えることは少な目でも合格レベルに達することができると思いますが、それでも概要の理解を行っておくことは最低限必要だと思います。
受験時にチートシートを見てゼロから理解するのはさすがに時間が厳しいです。
暗記よりも理解に重きを置きましょう。
私は購入していないので積極的に推すことはできませんが、概要把握にはいわゆる公式テキストも有効だったのかもしれません。
以下に個人的に理解しておくべき分野(要素)とコメントを書いていきます。もちろん理解は深いに越したことはなく理解が進むほど盤石になっていきますが、最低限これぐらいは必要かなと感じたところ。
■AIブームの流れ
→基本的な用語などとセットで比較的頭に入りやすい得点源になる分野かと。マンガや軽めの参考書などでさっと押さえておくとよいと。人名などはチートシートで。
■教師あり学習、教師なし学習
→入力値、出力値などの違い。時間削減のために超代表的な手法など。
■強化学習
→参考書などの概要レベルは把握すべき。どんな活用があるか。上記で紹介した参考書にはQ学習の関数関連の問題もありましたがそこまではあまり理解しなくても問題ありませんでした。出題される問題セットによるかもしれません。
■アンサンブル学習
→問題集で初見だと分からなかったが、概要でも理解しておけば比較的得点源になりやすい印象。
■過学習、勾配消失
→機械学習における代表的な問題。いろいろな問題にキーワードとして散見された印象。なぜ起きるのか。起きるとどうなるのか。どうすれば解消できるのか。私自身は独学で平易なプログラムとは言え実装経験があったのでそこまで苦労はしませんでした。
■活性化関数
→どこで使われるのか。どのような活性化関数だと問題があり、どんなものが主流なのか。関数の名前や数式は最悪チートシートでもなんとかなるかもしれません。
■ディープラーニング
→それ以外の機械学習との違い。なぜよいのか。
■事前学習、オートエンコーダ
→仕組みが得点に直結しやすい印象。
■CNN
→畳み込みと言われる仕組み。なぜ画像処理に使用されるのかイメージがつくといいかもしれない。
■RNN
→なぜ自然言語処理分野に強いか。
出題された問題とかをたどるといくらでも挙がりますが、特にと言われたらこんなところかなぁと思います。
基本的なところは理解しておくと、知らない用語や分野でもある程度「当て勘」が働くようになると思います。私の当て勘がどの程度当たったのかは試験結果では分かりませんが。。
試験時のチートシート活用
チートシートに関しては以下の三種を活用しました。
・自身がまとめたチートシート
【G検定】G検定対策の自分用メモ - SEワンタンの独学備忘録
・他ブログ様のチートシート
【資格試験対策】ディープラーニングG検定【キーワード・ポイントまとめ】 - ITとかCockatielとか
・模擬試験の解答解説ページ
G検定(AIの検定)模擬テスト – Study-AI
模擬試験についてでだけ補足します。
上記でも紹介した模擬試験ですが、やはりかなり優秀でその解答解説だけでも試験に役に立ちます。
私は模擬試験の「新シラバス対応 約100題」を当日の朝に解いたのですが、まとめ直す時間がなかったのでその解答解説ページをそのままチートシートとして活用させていただきました。
さて、チートシートが使用できる資格試験というのは私はあまり受けた経験がなかったのですが、特に時間制約の厳しい本試験ではチートシートのインデックスを作成しておくことが重要だと感じました。
簡単に言えばどこに何が書かれているか把握しておくということで、作成しておくといってもさらに別のドキュメントを作成するわけではなく頭に入れておくと言う意味です。
チートシートを多用する場合にもこの辺で時間削減を行います。
チートシートを自身で作成した場合には作成した段階で概ね内容は把握できているでしょう。
また、この観点からも模擬試験の解答解説をチートシートに活用するのは有効で、一度真剣に向き合った問題ならば詳細までは覚えてなくてもどんな問題が出題されたかぐらいは記憶に残っているはずです。
チートシートの他に参考書(問題集)も置いておきましたが、参考書はこの箇所を見れば確実に解答できるという一回だけ参照しました。
その他試験内容関連メモ
■数学・統計分野について
結果からも分かる通り、この辺に関しては対策が甘かったかもしれません。特に集中的な対策は行いませんでした。
元々数学分野に弱い場合には何かしら対策を行った方が盤石になるかもしれません。
■法律・時事分野について
この辺は対策が難しいと前評判でも見ていました。実際、確実に押さえようとするとかなりの学習が必要になりそうです。
ただ今回の試験で言えば、全体的にはなんとなくでも解答できる問題がそれなりにあった印象でした。この辺は情報処理技術者試験での関連法律に関する問題を解いた経験や、研修などで身に着けたITリテラシーが大きかったかもしれません。ITエンジニアが本職の場合には合格レベルぐらいなら意外となんとかなる印象。
但し自動運転関連については全く触れたことがない分野であるため、チートシートに記載の上、軽く内容を確認しておきました。
■音声処理分野について
音声処理分野の音韻、音素、メル尺度などのキーワードは今回試験で追加された(?)ものなので、比較的出題数が多い印象を受けました。
出題率がそれなりにあるのは今回の試験限りの特徴となる可能性もありますが、この辺はweb模擬でかなりカバーできたと思います。