働き方改革の第一歩はドキュメンテーションの文化の醸成では、と思うところです。とにかくどこかに文章が残っていて、検索すればヒットすることの威力は大きい。
できれば整理されていて欲しいが、構造化された文章を書くのは疲れるので、まず文章になっていることが目指すべき状態。
自分の古巣である法務チームにはドキュメンテーションを徹底させている。家事育児世代の人が多く、リモートワークにも耐えられるチームを作りたかったので、まずチケット管理とドキュメンテーションを徹底させました。
マネジメントに近い仕事になると、情報のハブとして存在していること自体が仕事になってしまうので「仕事を緩める」選択肢は取りづらいところはありますね。
わたしが「男女共働き、両ゆるキャリ」という選択肢に懐疑的なのは、全産業のうちそれが達成できそうな業種は多くないのでは(特に現場がある系は)と思うからですね。
@clementia1960 実際に足を踏み入れるのかは別として、もはや小説を書くよりも、steamにビジュアルノベルゲームを発表するほうが興味をそそられる時代になったと考えています。
友人が面白いと言っていたので、『インディーゲーム・サバイバルガイド: ゲーム作家として生きていくための「めんどくさいこと」の極意』を買ってみました。
インディーゲーム制作の、ゲーム制作以外の部分(宣伝とか、外注とか、その他諸々の実務)について書かれた本で、基本的にゲーム制作を実際に始めるひと向けの実務書です。
読んでいる途中ですが、インディーゲームで食っていく方法について色々書かれていて、興味のある向きには楽しいです。
@clementia1960 その後のオチ。自動検品プログラムは、20冊を大体45分くらいで処理してくれた(遅いが家事をしてればいいので許容範囲)。
しかし1)ページ番号がある場所がまちまち、2)そもそもOCRの精度に結構限界がある、という感じであまりら使えるものはできなかった。
1)はいっそパターンの数だけ処理を繰り返せばいいだけだとは思う。
2)は調べたり勉強したりして、前処理などで精度改善か。
プラス速度改善もやってみよう。
@clementia1960
今回は、自炊した本の検品するのだるいな(ページ欠落やページ順番違いがないかどうかチェックする作業)と思ったので、
「ページ右端だけにOCRかけたらページ番号だけ抜けないか? それが昇順かどうかだけ検証したらよくない」という思いつきから始まった。
まずtesseractのライブラリで画像OCRを試す
↓
pdf2imageで50ページくらいのPDFにもためしてみる。連番+各ページのテキストが50組できる。
↓
画像トリミング。範囲は勘で縦20%、横20%。
↓
トリミング範囲をチューニング
↓
うまくページ番号を取り出せるようになってきたら、数値以外を弾くようなフィルタを作る。配列に入れてprintしてみる。
↓
いけそうなので昇順かどうかを検証するコードを書く
↓
...みたいな。
Pythonだから大量ファイルの処理まで考えると、遅そうではある。
なんというか、日曜大工的なプログラミングでも、プログラミングという仕事自体がアジャイル的なんだというのは理解できる。
設計するというよりも、自分が把握できてテスト可能なパーツを作って、それを組み合わせて機能を増やしていって結果的に欲しいものに辿り着く感じが。
まあ日曜大工に計画はいらないんだけど。
自炊本の自動検品プログラム、概ねページが表示されていそうな座標がわかってきた。トリミング範囲がわかったので、あとは昇順になっているかどうかの検証の部分とループを書いたら終わりそうかな。
ガジェット買って体験がよくなったので、もう一つ行こうかなと思えてきましたね。
MacBookをモニターに繋げる持ち運び可能なドックが安定しないので、Caldigit TS3 Plus買おうかなーと思ってきた。
SFと映画が好き。ブログ本体はここ→http://clementiae.hatenablog.com 雑多な映画の感想はここ→http://clementiae2.hatenadiary.jp