UPPER SYSTEM

スポンサードリンク

1万円以上の商品を抽出したい時の正規表現

テキストファイルから1万円以上、すなわち5桁以上の数字を抽出したい場合、以下の正規表現が使えます。

 

\d{5,}

 

この正規表現が意味するところは、\dが数字を表します。そして、{}で桁を指定しています。

 

{5,6}であれば5桁以上6桁未満、{5,}であれば5桁以上の数字が抽出可能です。
ただし、{,5}のような書き方で5桁以下を抽出するという表現は通じません。

 

もし、3桁ごとにカンマが入っているような場合には、まずは作業ファイルとしてカンマを空白に置換するか、以下のような正規表現でも引っ掛けることが可能かと思います。

 

\d.*\d{2,}.*,\d{3}

 

↑はやや野暮ったいので他にも良い表現があると思います。

 

是非教えてくださるとうれしい所です。

 

このエントリーをはてなブックマークに追加  

スポンサードリンク

関連ページ

行頭に任意の文字を加える正規表現
SQLを作成する際に数十行のカラム名の前に,(カンマ)を付けたい!なんてときに私が行う処理の方法をご紹介いたします。
10桁以上の数字だけを抽出する正規表現
処理のレスポンスが帰らない結果として障害が発生。ログを調査します。そんなときに処理時間が長いリクエストを特定するために役立つ正規表現。
最長マッチと最短マッチの正規表現
”「ABCDEFG」は「基本的」な「アルファベット」です。”この文章から”基本的”だけを抽出するには?
任意の文字列が含まれる行を削除する
正規表現の基礎です。これは良く使うものですので、ぜひ覚えておきましょう。
データから改行を削除する正規表現(詰めたい)
コピーしたデータに、改行が混ざっていて、取り除きたい時の対策です。覚えておくと日常業務に役立つこと間違いなしです。